PHP與Golang如何通訊?

PHP與Golang如何通訊?

最近遇到的一個場景:php項目中須要使用一個第三方的功能(結巴分詞),而github上面剛好有一個用Golang寫好的類庫。那麼問題就來了,要如何實現不一樣語言之間的通訊呢?php

常規的方案:

  • 用Golang寫一個http/TCP服務,php經過http/TCP與Golang通訊
  • 將Golang通過較多封裝,作爲php擴展。
  • PHP經過系統命令,調取Golang的可執行文件

存在的問題:

  • http請求,網絡I/O將會消耗大量時間
  • 須要封裝大量代碼
  • PHP每調取一次Golang程序,就須要一次初始化,時間消耗不少

優化目標:

  • Golang程序只初始化一次(由於初始化很耗時)
  • 全部請求不須要走網絡
  • 儘可能不大量修改代碼

解決方案:

  • 簡單的Golang封裝,將第三方類庫編譯生成爲一個可執行文件
  • PHP與Golang經過雙向管道通訊

使用雙向管道通訊優點:

1:只須要對原有Golang類庫進行不多的封裝
2:性能最佳 (IPC通訊是進程間通訊的最佳途徑)
3:不須要走網絡請求,節約大量時間
4:程序只需初始化一次,並一直保持在內存中git

具體實現步驟:

  • 1:類庫中的原始調取demogithub

          package main
          import (
              "fmt"
              "github.com/yanyiwu/gojieba"
              "strings"
          )
    
          func main() {
              x := gojieba.NewJieba()
              defer x.Free()
    
              s := "小明碩士畢業於中國科學院計算所,後在日本京都大學深造"
              words := x.CutForSearch(s, true)
              fmt.Println(strings.Join(words, "/"))
          }    

    保存文件爲main.go,就能夠運行web

  • 2:調整後代碼爲:編程

        package main
          import (
              "bufio"
              "fmt"
              "github.com/yanyiwu/gojieba"
              "io"
              "os"
              "strings"
          )
    
          func main() {
    
              x := gojieba.NewJieba(
                  "/data/tmp/jiebaDict/jieba.dict.utf8", 
                  "/data/tmp/jiebaDict/hmm_model.utf8", 
                  "/data/tmp/jiebaDict/user.dict.utf8"
              )
              defer x.Free()
    
              inputReader := bufio.NewReader(os.Stdin)
              for {
                  s, err := inputReader.ReadString('\n')
                  if err != nil && err == io.EOF {
                      break
                  }
                  s = strings.TrimSpace(s)
    
                  if s != "" {
                      words := x.CutForSearch(s, true)
                      fmt.Println(strings.Join(words, " "))
                  } else {
                      fmt.Println("get empty \n")
                  }
              }
          }

    只須要簡單的幾行調整,便可實現:從標準輸入接收字符串,通過分詞再輸出
    測試:數組

      # go build test
      # ./test
      # //等待用戶輸入,輸入」這是一個測試「
      # 這是 一個 測試 //程序
  • 3:使用cat與Golang通訊作簡單測試bash

    //準備一個title.txt,每行是一句文本
     # cat title.txt | ./test

    正常輸出,表示cat已經能夠和Golang正常交互了網絡

  • 4:PHP與Golang通訊
      以上所示的cat與Golang通訊,使用的是單向管道。即:只能從cat向Golang傳入數據,Golang輸出的數據並無傳回給cat,而是直接輸出到屏幕。但文中的需求是:php與Golang通訊。即php要傳數據給Golang,同時Golang也必須把執行結果返回給php。所以,須要引入雙向管道。
      在PHP中管道的使用:popen("/path/test"),具體就不展開說了,由於此方法解決不了文中的問題。
    雙向管道:函數

         $descriptorspec = array( 
              0 => array("pipe", "r"), 
                1 => array("pipe", "w")
          );
          $handle = proc_open(
              '/webroot/go/src/test/test', 
              $descriptorspec, 
              $pipes
          );
          fwrite($pipes['0'], "這是一個測試文本\n");
          echo fgets($pipes[1]);

    解釋:使用proc_open打開一個進程,調用Golang程序。同時返回一個雙向管道pipes數組,php向$pipe['0']中寫數據,從$pipe['1']中讀數據。性能

 

好吧,也許你已經發現,我是標題檔,這裏重點要講的並不僅是PHP與Golang如何通訊。而是在介紹一種方法: 經過雙向管道讓任意語言通訊。(全部語言都會實現管道相關內容)

測試:

經過對比測試,計算出各個流程佔用的時間。下面提到的title.txt文件,包含100萬行文本,每行文本是從b2b平臺取的商品標題

1: 總體流程耗時

# time cat title.txt | ./test > /dev/null

耗時:14.819秒,消耗時間包含:

  • 進程cat讀出文本
  • 經過管道將數據傳入Golang
  • Golang處理數據,將結果返回到屏幕

2:計算分詞函數耗時。方案:去除分詞函數的調取,即:註釋掉Golang源代碼中的調取分詞那行的代碼

time cat title.txt | ./test > /dev/null

耗時:1.817秒時間,消耗時間包含:

  • 進程cat讀出文本
  • 經過管道將數據傳入Golang
  • Golang處理數據,將結果返回到屏幕

分詞耗時 = (第一步耗時) - (以上命令所耗時)
分詞耗時 : 14.819 - 1.817 = 13.002秒

3:測試cat進程與Golang進程之間通訊所佔時間

time cat title.txt > /dev/null

耗時:0.015秒,消耗時間包含:

  • 進程cat讀出文本
  • 經過管道將數據傳入Golang
  • go處理數據,將結果返回到屏幕

管道通訊耗時:(第二步耗時) - (第三步耗時)
管道通訊耗時: 1.817 - 0.015 = 1.802秒

4:PHP與Golang通訊的時間消耗
編寫簡單的php文件:

      <?php
            $descriptorspec = array( 
                0 => array("pipe", "r"), 
                1 => array("pipe", "w")
            );

            $handle = proc_open(
                '/webroot/go/src/test/test', 
                $descriptorspec, 
                $pipes
            );

            $fp = fopen("title.txt", "rb");

            while (!feof($fp)) {
                fwrite($pipes['0'], trim(fgets($fp))."\n");
                echo fgets($pipes[1]);
            }

            fclose($pipes['0']);
            fclose($pipes['1']);
            proc_close($handle);

流程與上面基本一致,讀出title.txt內容,經過雙向管道傳入Golang進程分詞後,再返回給php (比上面的測試多一步:數據再經過管道返回)

time php popen.php > /dev/null

耗時:24.037秒,消耗時間包含:

  • 進程PHP讀出文本
  • 經過管道將數據傳入Golang
  • Golang處理數據
  • Golang將返回結果再寫入管道,PHP經過管道接收數據
  • 將結果返回到屏幕

結論:

1 :整個分詞過程當中的耗時分佈

使用cat控制邏輯耗時:        14.819 秒 使用PHP控制邏輯耗時: 24.037 秒(比cat多一次管道通訊) 單向管道通訊耗時: 1.8 秒 Golang中的分詞函數耗時: 13.002 秒

2:分詞函數的性能: 單進程,100萬商品標題分詞,耗時13秒 
以上時間只包括分詞時間,不包括詞典載入時間。但在本方案中,詞典只載入一次,因此載入詞典時間能夠忽略(1秒左右)

3:PHP比cat慢 (這結論有點多餘了,呵呵)
語言層面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%
單進程對比測試的話,應該不會有哪一個語言比cat更快。

相關問題:

  • 1:以上Golang源碼中寫的是一個循環,也就是會一直從管道中讀數據。那麼存在一個問題:是否是php進程結束後,Golang的進程還會一直存在?

    管道機制自身可解決此問題。管道提供兩個接口:讀、寫。當寫進程結束或者意外掛掉時,讀進程也會報錯,以上Golang源代碼中的err邏輯就會執行,Golang進程結束。
    但若是PHP進程沒有結束,只是暫時沒有數據傳入,此時Golang進程會一直等待。直到php結束後,Golang進程纔會自動結束。

  • 2:可否多個php進程並行讀寫同一個管道,Golang進程同時爲其服務?

    不能夠。管道是單向的,若是多個進程同時向管道中寫,那Golang的返回值就會錯亂。
    能夠多開幾個Golang進程實現,每一個php進程對應一個Golang進程。

最後,上面都是瞎扯的。若是你瞭解管道、雙向管道,上面的解釋對你基本沒啥用。但若是你不瞭解管道,調試上面的代碼沒問題,但稍有修改就有可能掉坑裏。哈哈,推薦一本書吧,《UNIX網絡編程》卷1、二,都看一下,也許要看兩個月,但頗有必要!

多讀書、多看報,少看網頁,多睡覺!

相關文章
相關標籤/搜索