from bs4 import BeautifulSoup from colorama import init,Fore,Back,Style init(autoreset=True) #f = open('html.html', 'w') f = ''' <!DOCTYPE html> <html lang="zh-cn"> <head> <!-- Global site tag (gtag.js) - Google Analytics --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-878633-1"></script> <script> window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'UA-878633-1'); </script> <title>w3school 在線教程</title> <link rel="stylesheet" type="text/css" href="/c5_20171220.css" /> <meta charset="gbk" /> <meta http-equiv="Content-Language" content="zh-cn" /> <meta name="description" content="全球最大的中文 Web 技術教程。" /> <meta name="robots" content="all" /> <meta name="author" content="w3school.com.cn" /> <meta name="Copyright" content="Copyright W3school.com.cn All Rights Reserved." /> <meta name="MSSmartTagsPreventParsing" content="true" /> <meta http-equiv="imagetoolbar" content="false" /> <link rel="icon" type="image/png" sizes="16x16" href="/ui2019/w3_16x16.png"> <link rel="icon" type="image/png" sizes="32x32" href="/ui2019/w3_32x32.png"> <link rel="icon" type="image/png" sizes="48x48" href="/ui2019/logo-48-red.png"> <link rel="icon" type="image/png" sizes="96x96" href="/ui2019/logo-96-red.png"> <link rel="apple-touch-icon-precomposed" sizes="180x180" href="/ui2017/logo-180.png"> </head> <body id="homefirst"> <div id="wrapper"> <div id="header_index"> <h1><a href="/index.html" title="w3school 在線教程" style="float:left;">w3school 在線教程</a></h1> <div id="searchui"> <form method="get" id="searchform" action="http://www.google.com.hk/search"> <input type="hidden" name="sitesearch" value="w3school.com.cn" /> <input type="text" name="as_q" class="box" id="searched_content" title="在此輸入搜索內容。" /> <input type="submit" value="Go" class="button" title="搜索!" /> </form> </div> </div> <div id="navfirst"> <ul id="menu"> <li id="h"><a href="/h.asp" title="HTML 系列教程">HTML 系列教程</a></li> <li id="b"><a href="/b.asp" title="瀏覽器腳本教程">瀏覽器腳本</a></li> <li id="s"><a href="/s.asp" title="服務器腳本教程">服務器腳本</a></li> <li id="d"><a href="/d.asp" title="ASP.NET 教程">ASP.NET 教程</a></li> <li id="x"><a href="/x.asp" title="XML 系列教程">XML 系列教程</a></li> <li id="ws"><a href="/ws.asp" title="Web Services 系列教程">Web Services 系列教程</a></li> <li id="w"><a href="/w.asp" title="建站手冊">建站手冊</a></li> </ul> </div> <div id="navsecond"> <h2>HTML 教程</h2> <ul> <li><a href="/html/index.asp" title="HTML 教程">HTML</a></li> <li><a href="/html5/index.asp" title="HTML5 教程">HTML5</a></li> <li><a href="/xhtml/index.asp" title="XHTML 教程">XHTML</a></li> <li><a href="/css/index.asp" title="CSS 教程">CSS</a></li> <li><a href="/css3/index.asp" title="CSS3 教程">CSS3</a></li> <li><a href="/tcpip/index.asp" title="TCP/IP 教程">TCP/IP</a></li> </ul> <h2>瀏覽器腳本</h2> <ul> <li><a href="/js/index.asp" title="JavaScript 教程">JavaScript</a></li> <li><a href="/htmldom/index.asp" title="HTML DOM 教程">HTML DOM</a></li> <li><a href="/jquery/index.asp" title="jQuery 教程">jQuery</a></li> <li><a href="/jquerymobile/index.asp" title="jQuery Mobile 教程">jQuery Mobile</a></li> <li><a href="/ajax/index.asp" title="AJAX 教程">AJAX</a></li> <li><a href="/json/index.asp" title="JSON 教程">JSON</a></li> <li><a href="/dhtml/index.asp" title="DHTML 教程">DHTML</a></li> <li><a href="/e4x/index.asp" title="E4X 教程">E4X</a></li> <li><a href="/wmlscript/index.asp" title="WMLScript 教程">WMLScript</a></li> </ul> <h2>服務器腳本</h2> <ul> <li><a href="/php/index.asp" title="PHP 教程">PHP</a></li> <li><a href="/sql/index.asp" title="SQL 教程">SQL</a></li> <li><a href="/asp/index.asp" title="ASP 教程">ASP</a></li> <li><a href="/ado/index.asp" title="ADO 教程">ADO</a></li> <li><a href="/vbscript/index.asp" title="VBScript 教程">VBScript</a></li> </ul> <h2>XML 教程</h2> <ul> <li><a href="/xml/index.asp" title="XML 教程">XML</a></li> <li><a href="/dtd/index.asp" title="DTD教程">DTD</a></li> <li><a href="/xmldom/index.asp" title="XML DOM 教程">XML DOM</a></li> <li><a href="/xsl/xsl_languages.asp" title="XSL 語言">XSL</a></li> <li><a href="/xsl/index.asp" title="XSLT 教程">XSLT</a></li> <li><a href="/xslfo/index.asp" title="XSL-FO 教程">XSL-FO</a></li> <li><a href="/xpath/index.asp" title="XPath 教程">XPath</a></li> <li><a href="/xquery/index.asp" title="XQuery 教程">XQuery</a></li> <li><a href="/xlink/index.asp" title="XLink 教程">XLink</a></li> <li><a href="/xlink/index.asp" title="XPointer 教程">XPointer</a></li> <li><a href="/schema/index.asp" title="Schema 教程">Schema</a></li> <li><a href="/xforms/index.asp" title="XForms 教程">XForms</a></li> <li><a href="/wap/index.asp" title="WAP 教程">WAP</a></li> <li><a href="/svg/index.asp" title="SVG 教程">SVG</a></li> </ul> <h2>Web Services</h2> <ul> <li><a href="/webservices/index.asp" title="Web Services 教程">Web Services</a></li> <li><a href="/wsdl/index.asp" title="WSDL 教程">WSDL</a></li> <li><a href="/soap/index.asp" title="SOAP 教程">SOAP</a></li> <li><a href="/rss/index.asp" title="RSS 教程">RSS</a></li> <li><a href="/rdf/index.asp" title="RDF 教程">RDF</a></li> </ul> <h2>.NET</h2> <ul> <li><a href="/aspnet/index.asp" title="ASP.NET 教程">ASP.NET</a></li> <li><a href="/aspnet/webpages_intro.asp" title="ASP.NET Web Pages - 教程">Web Pages</a></li> <li><a href="/aspnet/razor_intro.asp" title="ASP.NET Razor - 標記">Razor</a></li> <li><a href="/aspnet/mvc_intro.asp" title="ASP.NET MVC - 教程">MVC</a></li> <li><a href="/aspnet/aspnet_intro.asp" title="ASP.NET Web Forms - 教程">Web Forms</a></li> </ul> <h2>建站手冊</h2> <ul> <li><a href="/site/index.asp" title="網站構建">網站構建</a></li> <li><a href="/w3c/index.asp" title="萬維網聯盟 (W3C)">萬維網聯盟 (W3C)</a></li> <li><a href="/browsers/index.asp" title="瀏覽器信息">瀏覽器信息</a></li> <li><a href="/quality/index.asp" title="網站品質">網站品質</a></li> <li><a href="/semweb/index.asp" title="語義網">語義網</a></li> <li><a href="/careers/index.asp" title="職業規劃">職業規劃</a></li> <li><a href="/hosting/index.asp" title="網站主機教程">網站主機</a></li> <li><a href="/media/index.asp" title="網絡媒體教程">網絡媒體</a></li> </ul> <h2 id="link_about"><a href="/about/index.asp" title="關於 W3School">關於 W3School</a></h2> <h2 id="link_help"><a href="/about/about_helping.asp" title="幫助 W3School">幫助 W3School</a></h2> </div> <div id="maincontent"> <div class="idea" id="d1"> <h2>領先的 Web 技術教程 - 所有免費</h2> <p>在 w3school,你能夠找到你所須要的全部的網站建設教程。</p> <p>從基礎的 HTML 到 CSS,乃至進階的 XML、SQL、JS、PHP 和 ASP.NET。</p> <p><strong>從左側的菜單選擇你須要的教程!</strong></p> </div> <div class="idea" id="d2"> <h3>完整的網站技術參考手冊</h3> <p>咱們的參考手冊涵蓋了網站技術的方方面面。</p> <p>其中包括W3C標準技術:HTML、CSS、XML 。以及其餘技術,諸如 JavaScript、PHP、SQL 等。</p> </div> <div class="idea" id="d3"> <h3>在線實例測試工具</h3> <p>在 w3school,咱們提供上千個實例。</p> <p>經過使用咱們的在線編輯器,你能夠編輯這些例子,並對代碼進行實驗。</p> </div> <div class="idea" id="d4"> <h3>快捷易懂的學習方式</h3> <p>一寸光陰一寸金,所以,咱們爲您提供快捷易懂的學習內容。</p> <p>在這裏,您能夠經過一種易懂的便利的模式得到您須要的任何知識。</p> </div> <div class="idea" id="d5"> <h3>從何入手?</h3> <p>什麼是一個Web建設者須要學習的知識呢?</p> <p>W3School將爲您回答這個問題,在您成爲專業 Web 開發者的路上助一臂之力。</p> <p>若是您是初學者,請您閱讀《<a href="/web/index.asp" title="網站構建初級教程">網站構建初級教程</a>》。</p> <p>若是您是開發者,請您閱讀《<a href="/site/index.asp" title="網站構建">網站構建高級教程</a>》。</p> </div> <div class="idea" id="d6"> <h3>W3School 新聞</h3> <p> <a href="/cssref/index.asp" title="CSS 參考手冊">CSS3 參考手冊</a> 已上線,敬請批評指正。 </p> </div> <div class="idea" id="d7"> <h3>W3School 更新信息</h3> <p> <a href="/php/php_ref_calendar.asp" title="PHP Calendar 函數">參考手冊:PHP Calendar 函數</a> <a href="/php/php_ref_date.asp" title="PHP Date / Time 函數">參考手冊:PHP Date / Time 函數</a> <a href="/html/index.asp" title="HTML 教程">教程:HTML 教程</a> </p> </div> <div id="d8"> <h3>W3School 友情連接</h3> <p class="partner"> <a target="_blank" href="http://mozilla.com.cn/">Firefox 中文社區</a> <a target="_blank" href="http://www.w3ctech.com/">w3ctech</a> <a target="_blank" href="http://wetest.qq.com/?from=links_w3school">WeTest騰訊質量開放平臺</a> </p> </div> <div id="d9"> <h3>新浪微博</h3> <p><a target="_blank" href="http://weibo.com/w3schoolcomcn">W3School 官方微博</a></p> </div> <div id="d10"> <h3>微信公衆號</h3> <p>W3School 官方服務號</p> </div> </div> <div id="sidebar"> <h2>參考手冊</h2> <ul> <li><a href="/tags/index.asp" title="HTML 參考手冊">HTML/HTML5 標籤</a></li> <li><a href="/tags/html_ref_colornames.asp" title="HTML 顏色名">HTML 顏色</a></li> <li><a href="/cssref/index.asp" title="CSS 參考手冊">CSS 1,2,3</a></li> <li><a href="/jsref/index.asp" title="JavaScript 參考手冊">JavaScript</a></li> <li><a href="/jsref/index.asp" title="HTML DOM 參考手冊">HTML DOM</a></li> <li><a href="/jquery/jquery_reference.asp" title="jQuery 參考手冊">jQuery</a></li> <li><a href="/jquerymobile/jquerymobile_ref_data.asp" title="jQuery Mobile 參考手冊">jQuery Mobile</a></li> <li><a href="/vbscript/vbscript_ref_functions.asp" title="VBScript 函數">VBScript</a></li> <li><a href="/asp/asp_ref.asp" title="ASP 參考手冊">ASP</a></li> <li><a href="/ado/ado_reference.asp" title="ADO 參考手冊">ADO</a></li> <li><a href="/aspnet/aspnet_reference.asp" title="ASP.NET 參考手冊">ASP.NET</a></li> <li><a href="/php/php_ref.asp" title="PHP 參考手冊">PHP 5.1</a></li> <li><a href="/xmldom/xmldom_reference.asp" title="XML DOM 參考手冊">XML DOM</a></li> <li><a href="/xsl/xsl_w3celementref.asp" title="XSLT 元素參考手冊">XSLT 1.0</a></li> <li><a href="/xpath/xpath_functions.asp" title="XPath、XQuery 以及 XSLT 函數">XPath 2.0</a></li> <li><a href="/xslfo/xslfo_reference.asp" title="XSL-FO 參考手冊">XSL-FO</a></li> <li><a href="/wap/wml_reference.asp" title="WML 參考手冊">WML 1.1</a></li> <li><a href="/glossary/index.asp" title="W3C 術語表和詞典">W3C 術語表</a></li> </ul> <h2>字符集</h2> <ul> <li><a href="/tags/html_ref_charactersets.asp" title="HTML 字符集">HTML 字符集</a></li> <li><a href="/tags/html_ref_ascii.asp" title="HTML ASCII 參考手冊">HTML ASCII</a></li> <li><a href="/tags/html_ref_entities.html" title="HTML ISO-8859-1 參考手冊">HTML ISO-8859-1</a></li> <li><a href="/tags/html_ref_symbols.html" title="HTML 4.01 符號實體">HTML 符號</a></li> </ul> <h2>實例/案例</h2> <ul> <li><a href="/example/html_examples.asp">HTML 實例</a></li> <li><a href="/example/csse_examples.asp">CSS 實例</a></li> <li><a href="/example/xmle_examples.asp">XML 實例</a></li> <li><a href="/example/jseg_examples.asp">JavaScript 實例</a></li> <li><a href="/example/jsrf_examples.asp">JavaScript 對象實例</a></li> <li><a href="/example/hdom_examples.asp">HTML DOM 實例</a></li> <li><a href="/jquery/jquery_examples.asp">jQuery 實例</a></li> <li><a href="/jquerymobile/jquerymobile_examples.asp">jQuery Mobile 實例</a></li> <li><a href="/example/xdom_examples.asp">XML DOM 實例</a></li> <li><a href="/example/dhtm_examples.asp">DHTML 實例</a></li> <li><a href="/example/ajax_examples.asp">AJAX 實例</a></li> <li><a href="/example/vbst_examples.asp">VBScript 實例</a></li> <li><a href="/example/aspe_examples.asp">ASP 實例</a></li> <li><a href="/example/adoe_examples.asp">ADO 實例</a></li> <li><a href="/svg/svg_examples.asp">SVG 實例</a></li> <li><a href="/wap/wap_demo.asp" title="WAP 演示">WAP 實例</a></li> </ul> <h2>測驗/考試</h2> <ul> <li><a href="/html/html_quiz.asp">HTML 測驗</a></li> <li><a href="/html5/html5_quiz.asp">HTML5 測驗</a></li> <li><a href="/xhtml/xhtml_quiz.asp">XHTML 測驗</a></li> <li><a href="/css/css_quiz.asp">CSS 測驗</a></li> <li><a href="/xml/xml_quiz.asp">XML 測驗</a></li> <li><a href="/js/js_quiz.asp">JavaScript 測驗</a></li> <li><a href="/jquery/jquery_quiz.asp">jQuery 測驗</a></li> <li><a href="/sql/sql_quiz.asp">SQL 測驗</a></li> <li><a href="/asp/asp_quiz.asp">ASP 測驗</a></li> <li><a href="/php/php_quiz.asp">PHP 測驗</a></li> </ul> <h2>代碼驗證</h2> <ul> <li><a href="/site/site_validate.asp" title="網頁驗證">驗證HTML</a></li> <li><a href="/site/site_validate.asp" title="網頁驗證">驗證CSS</a></li> <li><a href="/site/site_validate.asp" title="網頁驗證">驗證XHTML</a></li> <li><a href="/site/site_validate.asp" title="網頁驗證">驗證XML</a></li> <li><a href="/site/site_validate.asp" title="網頁驗證">驗證WML</a></li> </ul> </div> <div id="footer"> <p id="p1"> W3School 簡體中文版提供的內容僅用於培訓和測試,不保證內容的正確性。經過使用本站內容隨之而來的風險與本站無關。 </p> <p id="p2"> <a href="/about/about_use.asp" title="關於使用">使用條款</a>和<a href="/about/about_privacy.asp" title="關於隱私">隱私條款</a>。版權全部,保留一切權利。 贊助商:<a target="_blank" href="http://www.ykinvestment.com/" title="上海贏科投資有限公司">上海贏科投資有限公司</a>。 <a target="_blank" href="http://www.miitbeian.gov.cn/">蒙ICP備06004630號</a> </p> </div> </div> </body> </html> ''' soup = BeautifulSoup(f,'lxml') ##print(soup.prettify()) #把要解析的字符串以標準縮進輸出 #soup.blablabla只能匹配第一個結果 print(Fore.WHITE + Back.MAGENTA + soup.title.string) #attrs獲取屬性,結果爲字典, eg: soup.blablabal.attrs print(soup.link.attrs) #獲取具體屬性記得[]內加'',有的返回str,有的list,決定於屬性是否惟一 print(soup.link.attrs['rel']) #簡寫不加attrs直接[]結果相同 print(soup.link['rel']) #嵌套選擇 eg: soup.節點.節點.節點.節點 print(soup.head.title) #關聯選擇 print(soup.div.content) #find_all(name,attrs,recursive,text,**kwargs)