文本編輯器打開大(巨型,巨大,大)文本文件

個人意思是100+ MB大; 這樣的文本文件能夠推擠編輯人員的範圍。 php

我須要瀏覽一個大的XML文件,可是若是編輯器有錯誤,則沒法瀏覽。 html

有什麼建議麼? linux


#1樓

技巧和竅門

爲何要使用編輯器查看 (大)文件? git

在* nix或Cygwin下 ,只需減小使用量便可 。 (有句名言「少便是多,或多或少」,由於「少」代替了之前的Unix命令「更多」,另外還能夠向上滾動。)在「少」下搜索和導航相似於Vim,可是沒有交換文件和不多的RAM。 github

GNU的Win32端口更少。 請參閱上面答案的「較少」部分。 web

佩爾

Perl適用於快速腳本,它的.. (範圍觸發器)運算符提供了一種很好的選擇機制,以限制您必須經歷的工做。 正則表達式

例如: swift

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

這將提取從1百萬行到2百萬行的全部內容,並容許您以更少的成本手動篩選輸出。 瀏覽器

另外一個例子: 網絡

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

當「正則表達式一」找到某些內容時,此操做開始打印,而當「正則表達式二」找到有趣的塊的末尾時,此操做中止。 它可能會找到多個塊。 篩選輸出...

日誌解析器

這是您能夠使用的另外一個有用的工具。 引用維基百科的文章

logparser是一種靈活的命令行實用程序,最初由Microsoft員工Gabriele Giuseppini編寫,用於自動化IIS日誌記錄的測試。 它旨在用於Windows操做系統,而且包含在IIS 6.0資源工具包工具中。 logparser的默認行爲相似於「數據處理管道」,方法是在命令行上獲取SQL表達式,而後輸出包含與該SQL表達式匹配的行。

Microsoft將Logparser描述爲功能強大的多功能工具,它提供對基於文本的數據(例如日誌文件,XML文件和CSV文件)以及Windows操做系統上的關鍵數據源(例如事件日誌,註冊表,文件系統和Active Directory。 輸入查詢的結果能夠在基於文本的輸出中自定義格式,或者能夠持久保存到SQL,SYSLOG或圖表等更特殊的目標。

用法示例:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

尺寸的相對性

100 MB不太大。 3 GB愈來愈大。 我曾經在打印和郵件設施工做,該設施創造了美國一流郵件的2%。 我擔任技術負責人的系統之一佔郵件總數的15%以上。 咱們處處都有一些大文件要調試。

和更多...

請隨時在此處添加更多工具和信息。 這個答案是社區Wiki的一個緣由! 咱們都須要更多有關處理大量數據的建議...


#2樓

VS Code (Windows,macOS,Linux)-具備漂亮GUI的免費和開放源代碼。 編輯了一個3.6 GB的JSON文件,只需一分鐘便可加載。 您必須有足夠的RAM才能加載文件。

免費的只讀查看器:

  • glogg (Windows,macOS,Linux)–已確承認處理多GB文件。 它的主要功能是正則表達式搜索。 具備選項卡,能夠直接從磁盤讀取文件,能夠監視/關注文件,並容許用戶標記行。
  • LogExpert (Windows)–「 GUI替代tail 。」 支持文件跟蹤,搜索,過濾,可配置的突出顯示,插件和外部工具。
  • 大文本文件查看器 (Windows)–極簡主義,可執行文件很小。 支持拆分視圖,文本主題自定義,正則表達式搜索和文件關注。
  • Lister (Windows)–更加小巧和簡約。 它是一個可執行文件,只有500 KB,但仍支持搜索(使用正則表達式),打印,十六進制編輯器模式和設置。
  • loxx (Windows)–支持如下,突出顯示,行號,大文件,正則表達式,多個文件和視圖等等。 免費版本有一些限制。

免費編輯:

  • VimEmacs (Windows,macOS,Linux)–經典Unix編輯器。 學習曲線陡峭,但效率很高。 它們的設置能夠調整以使其更快。
  • 大型文件編輯器 (Windows)–打開和編輯TB +文件,支持Unicode,使用不多的內存,具備XML特定的功能,幷包括二進制模式。
  • HxD (Windows)–十六進制編輯器,而不是文本編輯器; 可是它很是快並且有用。
  • GigaEdit (Windows)–支持搜索,字符統計和字體自定義。 但這是有問題的–對於大文件,它僅容許覆蓋字符,而不能插入字符; 它不將LF視爲行終止符,而僅將CRLF視爲行終止符。 並且很慢

內置程序(無需安裝):

  • less (macOS,Linux)–傳統的Unix命令行傳呼工具。 使您能夠查看幾乎任何大小的文本文件。 也能夠安裝在Windows上。
  • 記事本 (Windows)–較大的文件比較合適,尤爲是在自動換行功能關閉的狀況下。
  • MORE (Windows)–這是指Windows MORE ,而不是Unix more 。 一個控制檯程序,使您能夠一次查看一個屏幕的文件。

網絡瀏覽器:

  • htmlpen.com –能夠打開和語法突出顯示TB +文件。 容許編輯,但很是大的文件除外。 支持搜索,正則表達式和導出。
  • readfileonline.com –另外一個HTML5大文件查看器。 支持搜索。

付費編輯:

  • 010編輯器 (Windows,macOS,Linux)–打開巨大的文件(多達50 GB)。
  • SlickEdit (Windows,macOS,Linux)–打開大文件。
  • UltraEdit (Windows,macOS,Linux)–打開大於6 GB的文件,但必須對其進行更改才能使其實用:菜單»高級»配置»文件處理»臨時文件»打開不帶臨時文件的文件...
  • EmEditor (Windows)–很好地處理很是大的文本文件(官方最多可處理248 GB,但根據一份報告則可處理多達900 GB)。

最後,您是否嘗試過使用常規編輯器打開大文件? 一些編輯器實際上能夠處理至關大的文件。 特別是, Notepad ++ (Windows)和Sublime Text (Windows,macOS,Linux)支持2 GB範圍內的文件。

相關文章
相關標籤/搜索