我的用戶永久免費,可自動升級版Excel插件,使用VSTO開發,Excel催化劑功能第15波-接入AI人工智能NLP天然語言處理

上回提到如今是概念化時代,馬雲爸爸們每天演講各樣的概念,IT世界也在講ABC時代(A-AI人工智能,B-BigData大數據,C-Cloud Computing雲計算),在2017年,大把大佬們都大談特談人工智能,天貓精靈、小愛同窗等智能音箱也走進咱們生活了。今天告訴你們一個大好消息,連玩Excel的同窗們也能夠大談特談AI了人工智能,Excel催化劑把整套AI引進來,你們能夠在Excel上開心地玩耍起許多過去想都不敢想的事情,對非結構化的數據進行結構化分析。html

文章出處說明

原文在簡書上發表,再同步到Excel催化劑微信公衆號或其餘平臺上,文章後續有修改和更新將在簡書上操做, 其餘平臺不做同步修改更新,所以建議閱讀其餘出處的文章時,儘量跳轉回簡書平臺上查看。數據庫

視頻演示

https://v.qq.com/x/page/z0624o5lxyr.html服務器

功能介紹

人工智能涉及很大的領域,有語音識別、天然語言處理、視頻圖像識別等,本次接入的AI人工智能,針對Excel較有使用價值的文本天然語言處理方面,後續有機會再挖掘其餘語音、圖像是否有在Excel中使用場景再酌情增長。本次更新的功能在於接入了人工智能,真正實現人工智能是BAT們幫咱們作好的,咱們只是用他們作好的成果,小量使用還在免費的限度內,若要大量使用,須要向BAT們交相似水煤電般的使用費用。本次用到的收費性API有百度翻譯API和百度AI天然語言API。因Excel催化劑僅實現了功能部分,後期你們使用時請記得自行申請APPKey來使用,插件自帶的APPKey只是測試用途,不能知足大量人員一塊兒使用的。微信

 
API調用服務免費範圍

 

 
百度翻譯調用服務免費範圍

詳細功能之翻譯功能

翻譯功能使用的API爲百度翻譯API,月總免費流量爲200萬字符數,如上圖,簡單測試一下,流量已經使用了2.5萬,使用時記得申請本身的API,不要使用插件自帶的開發測試的API。函數

操做步驟

相似以前介紹的圖片插入功能,先選擇要翻譯的單元格區域,而後點擊【接入人工智能】=》【翻譯功能】,即彈出相應的設置窗體。工具

  • 源語言,若提供的原文有兩種語言,最好設置一下,若只有一種語言,程序可自行識別
  • 目標語言,必選,根據所須要翻譯的語種進行選擇,語種十分豐富,點開下拉可查看到。
  • 目標單元格偏移,相似以前插入圖片,是根據原文的單元格向左右或上下偏移的位置而設定,以下圖是把翻譯結果放在B列,原文A列的右邊1列。
     
    翻譯設置

     
    2

    正式大量使用前務必點擊AppKey設置,到百度翻譯網頁上進行註冊申請相應的AppKey,填寫到相應的位置,以下圖所示。
     
  • 翻譯效果學習


     
    翻譯

詳細功能之中文分詞

中文分詞暫未使用百度AI接口來獲取,使用本地版的結巴類庫實現,使用多少都不產生費用,分詞效果還算能夠,並配置有自定義詞典,方便自行維護特有詞語,如我須要對Excel催化劑 這個詞作分詞,不但願默認的把它分爲兩個詞 Excel和催化劑,這種效果須要在自定義詞典中維護。測試

詳細操做步驟

  1. 數據準備,和前幾回分享同樣,數據區域要符合規範性(無斷行斷列)。且需新增一列標識數據記錄的惟一性,爲後期分詞後能夠溯源是哪條記錄的待分詞列產生的分詞結果,有數據庫一對多關係的知識或熟練Vlookup函數的使用就很好理解。(若源數據可能很差找到組合多列的結果爲惟一列,以下圖的訂單編號+商品SKU組成惟一列,可手工對其簡單進行序號編號構造惟一列標識)大數據

     
    分詞數據源

     

  2. 選擇要分詞的數據區域,可點擊數據區域任一單元格便可,點擊按鈕【接入人工智能】=》【中文分詞】,便可彈出設置窗體以下所示網站


     
    中文分詞設置
  • 當前數據源信息,可查看選擇的數據區域是否和預期同樣,一樣可實現和上幾回相似的,隱藏行的數據將不進行處理。
  • 點擊下拉框選取惟一標識列和待中文分詞列,讓程序知道數據源中哪些列是對應上此兩列的。
  • 配置自定義詞典 若要增長自定義詞,點擊此按鈕,將打開【自定義詞典表.xlsx】文件,在【自定義詞典表】工做表中按格式添加便可,詞頻和詞性的定義見批註解釋。【結巴詞性表】定義了詞性是否要過濾,可自行調整或最終在結果表裏再手工調整也可。


     
    添加自定義詞
 
添加自定義詞-詞性定義
  • 點擊分詞操做便可完成。
    數據生成導出到新的智能表仍是現有智能表的區別,見上篇購物籃分析文章裏所解釋的。
    結果表中,已經可見有分詞列、詞性列和詞頻數三列,是否過濾是根據自定義詞典裏定義的帶過來,有了此結果表數據,再使用Vlookup或Powerpivot數據建模的方式,把源表和結果表進行關聯起來,可根據多個維度來作分詞的詞頻分析,如按商品年份或按商品類別來看各自的詞頻,實現動態交互式的分析報表。


     
    中文分詞結果表
  • 有了分詞後,再作一個當下時尚的詞雲效果,詞雲製做不少在線的網頁版工具,下圖爲https://wordart.com/網站作出的效果,可快速地發現用戶的評價中,對質量、面料、穿着溫馨度是比較關注的。
     
    詞雲

詳細功能之評論觀點提取

雖然說詞雲能夠較好地對中文字符串進行較爲準確的切割,但中文世界裏,一個意思可由許多的詞來表達,增長了分析的複雜度,如面料和布料實際上是一個意思,單單分詞後的效果不能太理想,且分詞下來,也無法把握到一個單元的評論中所表達的情感如何,因此用真正的人工智能去識別短句內包含的關鍵信息和引信息傳達的情感極性如何,仍是挺有必要的。

詳細操做步驟

和以上分詞步驟大致一致,先選擇數據區域,數據區域先作好惟一列的準備,而後配置過程當中也是惟一列和待處理文本列的人工處理映射關係

 
評論觀點提取配置
  • 評論行業類型 需根據待評論處理的來源,選擇相應的行業,如餐飲、3C、購物等。
  • AppKey設置 此處的設置和前面說起的翻譯功能使用的不同,整我的工智能功能,需用到兩處AppKey,翻譯是一處,評論這裏是另一處,請務必在大量使用前進行註冊申請。


     
    AI天然語言AppKey設置
  • 點擊【觀點提取】後便可出下圖的結果表效果,理想狀況下,一句評論和多個觀點時,會出現多條記錄,如SO1P1所示,同時提到質量和上身效果兩個維度。但同時也存在一些有觀點但提取不出來的狀況,不能在結果表中顯示,這些都是百度雲API提供的結果,但願它愈來愈智能,提取效果愈來愈好和準確吧。


     
    評論觀點提取結果表

詳細功能之情感傾向分析

和以上評論觀點提取也較爲相似,操做步驟幾乎相同,此處再也不重複羅列
情感傾向分析只對一句話的情感進行量化分析,顯示此句話表達的是消極、中性仍是積極的情感。有可能一句話既有消極的部分,也有積極的部分,而後最終它會計算出一個極性分類及此極性的判斷是可信度(置信度),同時也給出了積極和消極的機率數做參考,詳細以下圖所示。

 

 
情感分析

總結

這次Excel催化劑藉助外界人工智能的研究成果,將其接入到Excel中,給Excel賦予更加智能靈活的數據處理能力,即把現實世界中特別是電商時代下產生的大量的非結構化數據,對其進行切割分詞、評論關鍵信息提取標準化,及對評論內容進行量化的情感極性標註等,給Excel後續的數據分析帶來了可分析的維度和指標進行統計分析對比,實現分析非結構化數據的最終目標。同時也開闊了你們對Excel的認識,它不只僅是一款不合時的小型的製表小工具,給予它相應的催化劑,它也一樣在新時代綻開出無限精彩!無需藉助其餘工具實現且實現方法接近智能化,任何Excel普通用戶便可輕易駕馭!

系列文章

Excel催化劑安裝過程詳解及安裝失敗解決方法 - 簡書https://www.jianshu.com/p/4efcee38175a
Excel催化劑功能第1波-工做表導航 - 簡書 https://www.jianshu.com/p/d9b2ae29cebe
Excel催化劑功能第2波-數字格式設置 - 簡書 https://www.jianshu.com/p/a758ac3e77e2
Excel催化劑功能第3波-與PowerbiDesktop互通互聯 - 簡書https://www.jianshu.com/p/e05460ad407d
Excel催化劑功能第4波-一大波自定義函數高級應用,從新定義Excel函數的學習和使用方法 - 簡書 https://www.jianshu.com/p/534803771c20
Excel催化劑功能第5波-使用DAX查詢從PowerbiDeskTop中獲取數據源 - 簡書https://www.jianshu.com/p/21b2ca8fd2b8
Excel催化劑功能第6波-導出PowerbiDesktop模型數據字典 - 簡書https://www.jianshu.com/p/bc26a8dcdfce
Excel催化劑功能第7波-智能選區功能 - 簡書 https://www.jianshu.com/p/146748e484d5
Excel催化劑功能第8波-快速可視化數據 - 簡書 https://www.jianshu.com/p/ce7cca2baf89
Excel催化劑功能第9波-數據透視表自動設置 - 簡書https://www.jianshu.com/p/f872ace9aa90
Excel催化劑功能第10波-快速排列工做表圖形對象 - 簡書https://www.jianshu.com/p/eab71f2969a6
Excel催化劑功能第11波-快速批量插入圖片 - 簡書https://www.jianshu.com/p/9a3d9aa7ba7e
Excel催化劑功能第12波-快速生成、讀取、導出條形碼二維碼 - 簡書https://www.jianshu.com/p/76c6856bec12
Excel催化劑功能第13波-一鍵生成自由報表 - 簡書https://www.jianshu.com/p/af0ac9ce1819
Excel催化劑功能第14波-一鍵生成零售購物籃分析 - 簡書https://www.jianshu.com/p/35014c17dff2

關於Excel催化劑

Excel催化劑先是一微信公衆號的名稱,後來順其名稱,正式推出了Excel插件,插件將持續性地更新,更新的週期視本人的時間而定爭取一週可以上線一個大功能模塊。Excel催化劑插件承諾我的用戶永久性無償使用!

Excel催化劑插件使用最新的佈署技術,實現一次安裝,往後全部更新自動更新完成,無需重複關注更新動態,手動下載安裝包從新安裝,只需一次安裝便可隨時保持最新版本!

Excel催化劑插件下載連接:https://pan.baidu.com/s/1eT2znYM
因插件使用VSTO開發技術完成,插件的安裝須要電腦知足相關的環境配置才能運行,且需可鏈接外網的方式實現自動更新機制,若下載安裝過程當中有任何疑問或須要離線版安裝等,儘可能不單獨私聊詢問,加QQ羣可高效解決(羣內已聚集了VSTO開發、Powerbi技術、Sqlserver商業智能等方面的國內頂尖大牛人物,進羣的好處不用多說了)

 
Excel催化劑插件交流羣羣二維碼.png

 

取名催化劑,因Excel自己的強大,並不是全部人可以立馬享受到,大部分人仍是在被Excel軟件所虐的階段,就是頭腦裏很清晰想達到的效果,並且高手們也已經實現出來,就是本身怎麼弄都弄不出來,或者更糟的是還不知道Excel可以作什麼而停留在不斷地重複、機械、手工地在作着數據,耗費着無數的青春年華歲月。因此催生了是否能夠做爲一種媒介,讓廣大的Excel用戶們能夠瞬間點燃Excel的爆點,無需苦苦地掙扎地沒日沒夜的技巧學習、高級複雜函數的燒腦,最終走向了從入門到放棄的道路。

最後Excel功能強大,其實還需樹立一個觀點,不是全部事情都要交給Excel去完成,也不是全部事情Excel都是十分勝任的,外面的世界仍然是一個廣闊的世界,Excel只是其中一枚耀眼的明星,還有其餘更多一樣精彩強大的技術、工具等。*Excel催化劑也將借力這些其餘技術,讓Excel可以發揮更強大的爆發!

關於Excel催化劑做者

姓名:李偉堅,從事數據分析工做多年(BI方向),一名一樣在路上的學習者。
技術路線從一名普通用戶,經過Excel軟件的學習,今後走向數據世界,非科班IT專業人士。
歷經重重難關,終於在數據的道路上達到技術平原期,學習衆多的知識再也不太吃力,同時也造成了本身的一套數據解決方案(數據採集、數據加工清洗、數據多維建模、數據報表展現等)。

擅長技術領域:Excel等Office家族軟件、VBA&VSTO的二次開發、Sqlserver數據庫技術、Sqlserver的商業智能BI技術、Powerbi技術、雲服務器佈署技術等等。

2018年開始職業生涯做了重大調整,從原來的正職工做,轉爲自由職業者,暫無固定收入,暫對前面道路不太明朗,苦從新回到正職工做,對Excel催化劑的運營和開發一定受到很大的影響(正職工做時間內不可能維護也不可能隨便把工做時間內的成果公佈於外,工做外的時間也十分有限,因已而立之年,家庭責任重大)。

和廣大擁護者一同期盼:Excel催化劑一直能運行下去,我所惠及的羣體們可以給予支持(多留言鼓勵下、轉發下朋友圈推薦、小額打賞下和最重點的能夠和所在公司及同行推薦推薦,讓個人技術能夠在貴司發揮價值,實現共贏(初步設想能夠數據顧問的方式或一些小型項目開發的方式合做)。)

相關文章
相關標籤/搜索