利用pandas將excel中數據抽取,以三元組形式加載到neo4j數據庫中構建相關知識圖譜python
python3.6.5
windows10
具體包依賴能夠參考文件requirements.txtgit
pip install -r requirements.txt
Excel數據結構以下github
經過函數data_extraction和函數relation_extrantion分別抽取構建知識圖譜所須要的節點數據以及聯繫數據,構建三元組。
數據提取主要採用pandas將excel數據轉換成dataframe類型
invoice_neo4j.py
數據庫
DataToNeo4jClass.py
windows
詳細內容請到github上下載 項目地址數據結構
數據驅動變革-雲將 我的博客地址函數