需求:最近作一個word新聞規範掃描的工具,須要將wold中的內容讀取出來掃描可疑、錯誤詞文本,並將錯誤可疑文本添加背景顏色。
內容掃描規範識別不在本文中描述,重點說怎樣經過編程語言操做word實現文字添加背景色。php
爲了能快速達到效果,直接在https://github.com/PHPOffice/... 這個項目上擴展的功能:git
<?php namespace PhpOffice\PhpWord; class Template extends TemplateProcessor { public $tempDocumentMainPart; public function __construct($documentTemplate) { parent::__construct($documentTemplate); } static $wordArr; static $color = 'yellow'; /** * 多個詞替換目前替換背景色功能 * * @param $word * @param $color * @example { * $template = new \PhpOffice\PhpWord\Template($path); * $template->setWordBgColor($txt, 'yellow'); * } */ public function setWordArrBgColor($word, $color) { self::$wordArr = array_unique($word); if (!empty(self::$wordArr)) { self::$color = $color; $this->tempDocumentHeaders = $this->_replace($this->tempDocumentHeaders); $this->tempDocumentMainPart = $this->_replace($this->tempDocumentMainPart); $this->tempDocumentFooters = $this->_replace($this->tempDocumentFooters); } } private function _replace($content) { return preg_replace_callback( '/<w:r w:([^>]*)>((?:(?!<\w:r>)[\s\S])*)<w:t[^>]*>((?:(?!<\/w:r>)[\s\S])*)<\/w:t><\/w:r[^>]*>/iUs', function ($matches) { // print_r($matches); if (!empty(trim($matches[3]))) { $text = $matches[3]; foreach (self::$wordArr AS $value) { // 判斷關鍵詞在字符串中是否存在 if (false !== strpos($text, $value)) { // 背景色屬性 $bgAttr = empty($matches[2]) ? '<w:rPr><w:highlight w:val="'.self::$color.'"/></w:rPr>' : str_ireplace('</w:rPr>', '<w:highlight w:val="'.self::$color.'"/></w:rPr>', $matches[2]); $matches[0] = str_ireplace($value, '</w:t></w:r><w:r w:'.$matches[1].'>'.$bgAttr.'<w:t>'.$value.'</w:t></w:r><w:r w:'.$matches[1].'>'.$bgAttr.'<w:t>', $matches[0]); } } if (!empty($matches[0])) { // 過濾掉空的 $matches[0] = preg_replace('/<w:r w:[^>]*>(?:(?!<\w:t>)[\s\S])*<w:t[^>]*><\/w:t><\/w:r[^>]*>/iUs', '', $matches[0]); } } return $matches[0]; }, $content); } }
//引入類庫 require autoload.php $path = './test.docx'; $template = new \PhpOffice\PhpWord\Template($path); $template->setWordArrBgColor(['TMD', '臺灣省', 'Caonima'], 'yellow');