字王20年html
95年,字王發佈了《中華大字庫》,不經意間,二十年過去了。python
20年來,一直有人問我,有上市公司的主席,也有獲過國際大獎的專家學者:git
「你作這個幹什麼?」github
「盜版這麼多。。。」算法
「字庫又不賺錢?」網絡
。。。。。。app
why?機器學習
最先,是由於在書上看到,「漢字是中國五千年惟一保留的傳統文化。」oop
網絡世代,更加神奇:學習
「中國遠遠早於聖經寫做年份而發明的漢字裏隱藏着與聖經記載相同的信息,這超出了人類的智慧。」
「中國方塊字隱含着與聖經記載相同的上帝的信息、上帝的思想、上帝的教誨,是上帝的密碼。」
「漢字,是目前世界上惟一保留着上帝真道教誨的文字。」
。。。。。。
-----------------------------------
字王、字庫與大數據、量化交易的關係,你們能夠瀏覽《大數據、趨勢與黑天鵝》http://blog.sina.com.cn/s/blog_7100d4220102vn8s.html
國標2級是每套字庫6700多個漢字,按256x256像素採樣,每一個漢字128k(64k x 2)字節數據,一套字模差很少700M(兆)字模的篩選率是百分之一,每套合格字模,須要處理70G的數據。可能,黑天鵝算法最先的靈感和萌芽,就是不經意間源自這裏。
2000年,咱們作「千禧版」版權登記,共一千套字體,數據總量超過1000 x 70G=70T,是阿里健康的七十倍。
當時沒有超算,沒有GPU,咱們是幾臺電腦,天天24小時運算,差很少半年才作完。
其實,早在92年,咱們180款的字模,數據量就差很少20T,是阿里健康的二十倍。那時候dvd剛問世,剛開始只有視頻dvd,沒有電腦的,我還特地去廣州海印xx公司看過了dvd演示效果
在大數據領域,200萬億數據,只是小case嚇唬外行有用,一線的,再多數據,不過是多幾個索引表而已,並且現代k-v表,所有采用hash算法,與數據規模關係不大。
-----------------------------------
這塊一直都是我的資金在操做,不免有不少足,不過收穫,卻也是實實在在的,提及來,不比幾大字庫企業差。
現在,回頭再看,95版的《中華大字庫》,是全球首款個性化中文字庫,開創了中文字體個性化時代,比文鼎相似字庫要早近十年。
98年,字王《人工智能與中文字型設計》入選《廣東青年科學家論文集》(中國科技出版社出版)
現在,字王的中文字體「智能建模」理論,已經成爲字庫行業三大字庫建模理論之一,也是惟一具有工業化、產業化的中文字庫建模理論。
百度百科、互動百科的「字體」詞條,均原文大段引用字王論文。以及相關文檔。
2000,發佈《中華大字庫》千禧版,
2005,並首度對做品進行了版權登記
2012,字王發佈x2ttf,塗鴉造字公益軟件,全功能免費下載,準開源模式。
2015,字王4K雲字庫,成爲首個進駐github的中文雲字庫項目
2015,zwPython,字王SDK升級版,除少數字模核心模塊外,所有采用開源模式,免費下載
zwPython 3.0目標:目前最強的集成式Python開發平臺,大數據分析平臺,沒有之一:
:: 比pythonXY更增強大,內置全中文用戶手冊;
:: 蘋果「開箱即用」模式,綠色軟件,解壓便可,零配置。
:: 首個All-in-one大數據分析平臺:內置pandas、Scala、R語言、Q語言、Quant、matlab、hadoop、spark模塊庫和API接口支持。(僅限V3.0版本)
:: 超強功能:圖像處理、AI人工智能、機器學習、openCV人像識別、gpu、openCL並行超算開發、pygame遊戲設計......
雖然字王網站,目前處於封閉升級、戰略調整當中,
但字王的口號:
咱們只談原創!
咱們始終第一!
二十年,在中文字庫行業,至今無人可以超越。
一直以來,總有些所謂的設計師,
這些設計師,也許熟悉ps,不過鮮見有做品發佈,尤爲是須要紮紮實實,設計六千多字形的中文字庫
這些ps設計師,多年以來,一直認爲字王的字體缺少美學、沒有設計
做爲理工背景的咱們,一直容忍,少作回擊。
不過,之後再有人,特別是本身沒有做品的ps設計師,噴字王的字體難看
請閣下先show下本身好看的字庫,少於一百套免談。
日本的設計,向來以注重細節,創做嚴謹著稱。
現在網絡盛傳的「日本三次元字體」,被業內稱爲「迫力滿格」
聽說是日本fub工房2007年的做品
http://www2s.biglobe.ne.jp/~fub/font/3Dkirieji.html
可事實上,這個所謂的「日本三次元字體」,是抄襲字王95版《中華大字庫》「拙體字」,只是對字王「拙體字」進行了一個簡單的3D拉邊處理。
雖然二十年前的資料很差查尋,幸運的是,「拙體字」是筆者最喜歡的字體之一,而且是95版《中華大字庫》的封面字體。
你們不妨下載「日本三次元字體」,與95版嘉隆《中華大字庫》的demo圖片對比下,類似度99%。
雖然創做也偶有「撞衫」,但不管從知識產權,仍是創做角度而言,「撞衫」也是侵權。
奇怪的是,不只這款「日本三次元字體」,fub工房的其餘幾款字體:mofuji,切匯字、水面字、甚至正在製做中的ibaraji字體,都與《中華大字庫》千禧版的字形高度類似。
http://www2s.biglobe.ne.jp/~fub/font/font.html
日本的工業,包括字體產業,一直強於國內,這個,至今都是如此。
不過,強大的日本字庫產業,竟然出現了一款抄襲字王二十年前的做品,這個也是不爭的事實。
用這個「日本三次元字體」打臉,對於這些ps設計師,也算是有個交代了。
爲了正本清源,筆者已經給日本大使館遞交了mail,但願可以認真處理。
日本畢竟是發達國家,在知識產權方面,也應該更加規範些。
現在流傳甚廣的剪紙體,以及n多相似的個性化字體,從創做角度而言,都是源自字王的拙體。
《中華大字庫》,不管是95年180款的版本,2000年千禧版的1000款字體,仍是字王目前正在規劃的4K雲字庫。
字王「智能建模」,經過AI人工智能技術,以及目前時髦的大數據,基本上涵蓋了個性化中文字體的方方面面。
無他,由於字王是中文個性化字庫的鼻祖,作的早,老是有些先發優點。
這些,已是歷史,無需爭辯。
歡迎熟悉日文、知識產權的網友提供協助
------------
ps:給日本大使館的公開信:
標題:關於「日本三次元字體」抄襲字王做品事件
正文:
先生,你好
日本的字體工業,一直強於中國,這個,至今都是如此。
不過,強大的日本字庫產業,竟然出現了一款抄襲字王二十年前的做品,這個也是不爭的事實。
日本畢竟是發達國家,在知識產權方面,也應該更加規範些。
日本的設計,向來以注重細節,創做嚴謹著稱。
現在網絡盛傳的「日本三次元字體」,被業內稱爲「迫力滿格」
是日本fub工房2007年的做品,http://www2s.biglobe.ne.jp/~fub/font/3Dkirieji.html
事實上,這個所謂的「日本三次元字體」,是抄襲字王95版《中華大字庫》「拙體字」,只是對字王「拙體字」進行了一個簡單的3D拉邊處理。
雖然二十年前的資料很差查尋,幸運的是,「拙體字」是筆者最喜歡的字體之一,而且是95版《中華大字庫》的封面字體。
你們不妨下載「日本三次元字體」,與95版《中華大字庫》的demo圖片對比下,類似度99%。
雖然創做也偶有「撞衫」,但不管從知識產權,仍是創做角度而言,「撞衫」也是侵權。
中日雖是鄰國,但畢竟是千里以外,筆者又不通日文,缺少相關資源。
懇請貴機構可以妥善查處此事,正本清源.
更多資料,請瀏覽blog:http://blog.sina.com.cn/zbrow
《字王20年》http://blog.sina.com.cn/s/blog_7100d4220102vqcf.html
字王
QQ,357811718
2015,8,11,晚上,與李旭科書法字做者,在Q上聊了下
有些資料 涉及到字庫設計、字庫產業,對你們也有益處
按慣例 沒細整理,直接發blog了
-----------------------
SL** : 請問中華大字庫是你的做品吧?
字王 : 是啊
SL** : 如今網上處處都能下載到 應該是有版權的吧
字王 : 《字王20年》
http://blog.sina.com.cn/s/blog_7100d4220102vqcf.html
字王 : 作過版權登記 不過國內字體版權保護,目前爭議很大 國外也是
我是按美術做品保護的
SL** : 我看過你的博客 我也認識梁老師
字王 : 沒期望用這個賺錢 是個學術項目
SL** : 但你的這個應該是軟件吧
SL** : 恩 這個特別實用對製做字體
字王 : 不是軟件 是字模
軟件是字王智能字模開發平臺 zw-sdk
如今升級版是zwPython
字王 : x2ttf 你說的是這個 塗鴉造字
是個公益軟件 全功能 全免費的 2012的做品
SL** : 恩
字王 : 你的字是本身寫的? 有沒有我的網站 blog
SL** : 恩 沒有 以前有一個是請人作的 但人找不到了因此網站關閉了
SL** : 請教一下字模主要是幹什麼的
字王 : 開個blog 字王網站在升級 暫時也關閉了
目前主要是更新blog
字王 : 字模就是字型
黑體 宋體 等都是
字王主要作個性化字體 應該是鼻祖了
SL** : 但的確字體盜版侵權太厲害 個人字曾經用在舌尖上的中國第二季 但並無通過個人贊成
SL** : 那作這個字模有收入嗎 如今這個狀況
字王 : 全部字庫這塊我是慢慢推 有時間就整點
不過字王雲字庫,會是全免費的
互聯網的核心就是 free+open
字王 : 我作字庫這塊 95年作中華大字庫,當時就投入三十多萬
光碟開模費就幾萬,字庫項目一直沒賺錢
不過,這塊對於個人技術。課題提高很快
目前我作互聯網 網絡營銷 大數據
核心技術 都是字王的智能字模 底層模塊都是AI 人工智能
SL** : 哦 具體我仍是有點不太懂 對我有點太專業
字王 : 簡單說 在中文字模這塊 字王是全世界作的最好的
有了這樣一個高度 看問題
很發現其餘行業 也不過如此
08年我作網絡公關 之前歷來沒有作過公關
一年 成爲行業老大 又是一個第一
(高度決定一塊兒,在學術界,字庫行業,至少目前沒有人,敢在字王目前,稱王稱霸)
SL** : 那麼如今你還在堅持作這個嗎
字王 : 在作 github 中文雲字庫 字王又是第一
目前zwPython在升級 3.0的
SL** : 雲字庫之前聽過 但這方面市場感受仍是不夠理想吧?
字王 : 這個不須要市場
中文字體是種稀缺 資源
目前全世界的市場都處於飽和 超飽和狀態
手機app,免費下載 推廣費都要 5元一個
雲字庫 至少字王的雲字庫 不擔憂市場 用戶 至少一個億的用戶沒問題
(目前排名前三的手機輸入法,市場估值都超過一億,字庫的技術含量,特別是雲字庫,比輸入法高至少2-3個數量級,並且字庫版權,自然具備排他性、壟斷性,按目前移動互聯網的IP模式,市場估值,至少是數百億。不過雲字庫種類的起點,至少是1K中文字庫,因此。。。。)
不過啓動費用也不低
因此,如今 字王一方面在找錢 一方面在攢錢
SL** : 字王的雲字庫包括不少種字體吧
字王 : 字王獨家擁有超過一千款中文個性化字庫毛胚和版權,比全球其餘全部字庫公司加起來都多。
SL** : 這麼多 全是你和你的團隊開發的,仍是有合做的?
字王 : 咱們本身的 字王是經過AI智能技術 電腦合成 人工篩選
SL** : 不過即便這樣也應該特別費時費工
字王 : 是啊 字王20年了
SL** : 對了 我請教你一個具體問題
SL** : x2ttf自動生成的字體是開源免費的嗎
字王 : 準開源 源程序 由於涉及字王的底層代碼 沒開放
其實 看源碼不如看fontforge、fonttool的 不少都是python
看起來 更加輕鬆
SL** : 哦 x2ttf能夠製做繁體嗎
字王 : 沒問題 不過內碼 必須是GB
SL** : 如今你有和這些字體公司合做嗎?
SL** : 電視臺 影視公司 還有如今的移動設備中大量用到字體 但平時也沒有看到過字王的字體
字王 : 沒有 談不攏 字庫公司都是傳統的軟件公司 很古板
我是作互聯網的 操做方式不一樣
上海xx網的,老總算是年輕的,聊過n次 仍是談不攏
思惟方式不一樣
SL** : 恩 就是 我準備開發的一套字體 他們嫌筆畫不勻稱 原本是毛筆書法 能看出來仍是太過保守
字王 : 字王的最終字體產品不多 我是作企業的
國內字體不保護 沒辦法 一套字體毛胚 人工修正的費用至少是五千 行業平均是5萬 如今應該不低於一萬
不過 不少字體 都是在字王的毛胚上衍生的
SL** : 哦
SL** : 如今狀況有所好轉 漢儀聽新聞上說最近幾年開始盈利了
字王 : 挺好看的 我對這塊不講究
之前你們都說字王的字很差看
如今 字王揭開一個日本的盜版者:日本三次元刻繪字,盜用字王95年的拙體
你們應該會閉嘴 好好反思一下了
SL** : 恩 懂字 會挖掘價值的人仍是很少
字王 : 英文十年前就超過五萬 這個只是當年coreldraw的配套資源光盤上面的字體
如今至少 十萬英文字庫
目前全球的中文字庫 去掉簡繁粗細,總和不超過一百款。
因此 目前是(中文字庫)走量的時期
在1萬款之前 全部中文字庫
都是:存在就是合理的
你們沒的選
(目前,你們對於中文字庫,沒得選擇,屬於短缺經濟時代)
SL** : 不過好的中文字體開發的難度就是大點
SL** : 字數太多了
字王 : 因此說字王才偉大 :)
字王 : 而字王雲字庫,基於人工智能,提出的「智能字模」技術,是目前惟一能夠突破千款瓶頸的中文字庫解決方案。
SL** : 呵呵 能不能理解成吧漢字按照規律拆分組合快速生產的一項技術?
字王 : 有這個設想 但願可以在100-300個漢字內 完成全部字庫部件
這個我2012年的blog就說過
目前 zwPython裏面的opencv 就有圖像識別模塊
不過 黑體和草體的 模塊庫確定不一樣
可能須要開發數十 甚至幾百種模板
目前 沒時間 等機會吧
SL** : 美術字的能夠 但書法字的這樣造出來的字感受缺點東西
字王 : 300字應該能夠 覆蓋一種字體了 書法字也差很少
SL** : 那麼如今zwPython主要有哪些功能
字王 : 你本身下載吧 有中文手冊