BeautifulSoup

from bs4 import BeautifulSoup
from colorama import init,Fore,Back,Style
init(autoreset=True)
#f = open('html.html', 'w')
f = '''

<!DOCTYPE html>
<html lang="zh-cn">
<head>

    <!-- Global site tag (gtag.js) - Google Analytics -->
    <script async src="https://www.googletagmanager.com/gtag/js?id=UA-878633-1"></script>
    <script>
  window.dataLayer = window.dataLayer || [];
  function gtag(){dataLayer.push(arguments);}
  gtag('js', new Date());

  gtag('config', 'UA-878633-1');
    </script>

    <title>w3school 在線教程</title>

    <link rel="stylesheet" type="text/css" href="/c5_20171220.css" />
    <meta charset="gbk" />
    <meta http-equiv="Content-Language" content="zh-cn" />
    <meta name="description" content="全球最大的中文 Web 技術教程。" />
    <meta name="robots" content="all" />
    <meta name="author" content="w3school.com.cn" />
    <meta name="Copyright" content="Copyright W3school.com.cn All Rights Reserved." />
    <meta name="MSSmartTagsPreventParsing" content="true" />
    <meta http-equiv="imagetoolbar" content="false" />
    <link rel="icon" type="image/png" sizes="16x16" href="/ui2019/w3_16x16.png">
    <link rel="icon" type="image/png" sizes="32x32" href="/ui2019/w3_32x32.png">
    <link rel="icon" type="image/png" sizes="48x48" href="/ui2019/logo-48-red.png">
    <link rel="icon" type="image/png" sizes="96x96" href="/ui2019/logo-96-red.png">
    <link rel="apple-touch-icon-precomposed" sizes="180x180" href="/ui2017/logo-180.png">
</head>

<body id="homefirst">
    <div id="wrapper">

        <div id="header_index">
            <h1><a href="/index.html" title="w3school 在線教程" style="float:left;">w3school 在線教程</a></h1>

            <div id="searchui">
                <form method="get" id="searchform" action="http://www.google.com.hk/search">
                    <input type="hidden" name="sitesearch" value="w3school.com.cn" />
                    <input type="text" name="as_q" class="box" id="searched_content" title="在此輸入搜索內容。" />
                    <input type="submit" value="Go" class="button" title="搜索!" />
                </form>
            </div>
        </div>

        <div id="navfirst">
            <ul id="menu">
                <li id="h"><a href="/h.asp" title="HTML 系列教程">HTML 系列教程</a></li>
                <li id="b"><a href="/b.asp" title="瀏覽器腳本教程">瀏覽器腳本</a></li>
                <li id="s"><a href="/s.asp" title="服務器腳本教程">服務器腳本</a></li>
                <li id="d"><a href="/d.asp" title="ASP.NET 教程">ASP.NET 教程</a></li>
                <li id="x"><a href="/x.asp" title="XML 系列教程">XML 系列教程</a></li>
                <li id="ws"><a href="/ws.asp" title="Web Services 系列教程">Web Services 系列教程</a></li>
                <li id="w"><a href="/w.asp" title="建站手冊">建站手冊</a></li>
            </ul>
        </div>

        <div id="navsecond">
            <h2>HTML 教程</h2>
            <ul>
                <li><a href="/html/index.asp" title="HTML 教程">HTML</a></li>
                <li><a href="/html5/index.asp" title="HTML5 教程">HTML5</a></li>
                <li><a href="/xhtml/index.asp" title="XHTML 教程">XHTML</a></li>
                <li><a href="/css/index.asp" title="CSS 教程">CSS</a></li>
                <li><a href="/css3/index.asp" title="CSS3 教程">CSS3</a></li>
                <li><a href="/tcpip/index.asp" title="TCP/IP 教程">TCP/IP</a></li>
            </ul>

            <h2>瀏覽器腳本</h2>
            <ul>
                <li><a href="/js/index.asp" title="JavaScript 教程">JavaScript</a></li>
                <li><a href="/htmldom/index.asp" title="HTML DOM 教程">HTML DOM</a></li>
                <li><a href="/jquery/index.asp" title="jQuery 教程">jQuery</a></li>
                <li><a href="/jquerymobile/index.asp" title="jQuery Mobile 教程">jQuery Mobile</a></li>
                <li><a href="/ajax/index.asp" title="AJAX 教程">AJAX</a></li>
                <li><a href="/json/index.asp" title="JSON 教程">JSON</a></li>
                <li><a href="/dhtml/index.asp" title="DHTML 教程">DHTML</a></li>
                <li><a href="/e4x/index.asp" title="E4X 教程">E4X</a></li>
                <li><a href="/wmlscript/index.asp" title="WMLScript 教程">WMLScript</a></li>
            </ul>

            <h2>服務器腳本</h2>
            <ul>
                <li><a href="/php/index.asp" title="PHP 教程">PHP</a></li>
                <li><a href="/sql/index.asp" title="SQL 教程">SQL</a></li>
                <li><a href="/asp/index.asp" title="ASP 教程">ASP</a></li>
                <li><a href="/ado/index.asp" title="ADO 教程">ADO</a></li>
                <li><a href="/vbscript/index.asp" title="VBScript 教程">VBScript</a></li>
            </ul>

            <h2>XML 教程</h2>
            <ul>
                <li><a href="/xml/index.asp" title="XML 教程">XML</a></li>
                <li><a href="/dtd/index.asp" title="DTD教程">DTD</a></li>
                <li><a href="/xmldom/index.asp" title="XML DOM 教程">XML DOM</a></li>
                <li><a href="/xsl/xsl_languages.asp" title="XSL 語言">XSL</a></li>
                <li><a href="/xsl/index.asp" title="XSLT 教程">XSLT</a></li>
                <li><a href="/xslfo/index.asp" title="XSL-FO 教程">XSL-FO</a></li>
                <li><a href="/xpath/index.asp" title="XPath 教程">XPath</a></li>
                <li><a href="/xquery/index.asp" title="XQuery 教程">XQuery</a></li>
                <li><a href="/xlink/index.asp" title="XLink 教程">XLink</a></li>
                <li><a href="/xlink/index.asp" title="XPointer 教程">XPointer</a></li>
                <li><a href="/schema/index.asp" title="Schema 教程">Schema</a></li>
                <li><a href="/xforms/index.asp" title="XForms 教程">XForms</a></li>
                <li><a href="/wap/index.asp" title="WAP 教程">WAP</a></li>
                <li><a href="/svg/index.asp" title="SVG 教程">SVG</a></li>
            </ul>

            <h2>Web Services</h2>
            <ul>
                <li><a href="/webservices/index.asp" title="Web Services 教程">Web Services</a></li>
                <li><a href="/wsdl/index.asp" title="WSDL 教程">WSDL</a></li>
                <li><a href="/soap/index.asp" title="SOAP 教程">SOAP</a></li>
                <li><a href="/rss/index.asp" title="RSS 教程">RSS</a></li>
                <li><a href="/rdf/index.asp" title="RDF 教程">RDF</a></li>
            </ul>

            <h2>.NET</h2>
            <ul>
                <li><a href="/aspnet/index.asp" title="ASP.NET 教程">ASP.NET</a></li>
                <li><a href="/aspnet/webpages_intro.asp" title="ASP.NET Web Pages - 教程">Web Pages</a></li>
                <li><a href="/aspnet/razor_intro.asp" title="ASP.NET Razor - 標記">Razor</a></li>
                <li><a href="/aspnet/mvc_intro.asp" title="ASP.NET MVC - 教程">MVC</a></li>
                <li><a href="/aspnet/aspnet_intro.asp" title="ASP.NET Web Forms - 教程">Web Forms</a></li>
            </ul>

            <h2>建站手冊</h2>
            <ul>
                <li><a href="/site/index.asp" title="網站構建">網站構建</a></li>
                <li><a href="/w3c/index.asp" title="萬維網聯盟 (W3C)">萬維網聯盟 (W3C)</a></li>
                <li><a href="/browsers/index.asp" title="瀏覽器信息">瀏覽器信息</a></li>
                <li><a href="/quality/index.asp" title="網站品質">網站品質</a></li>
                <li><a href="/semweb/index.asp" title="語義網">語義網</a></li>
                <li><a href="/careers/index.asp" title="職業規劃">職業規劃</a></li>
                <li><a href="/hosting/index.asp" title="網站主機教程">網站主機</a></li>
                <li><a href="/media/index.asp" title="網絡媒體教程">網絡媒體</a></li>
            </ul>

            <h2 id="link_about"><a href="/about/index.asp" title="關於 W3School">關於 W3School</a></h2>
            <h2 id="link_help"><a href="/about/about_helping.asp" title="幫助 W3School">幫助 W3School</a></h2>
        </div>

        <div id="maincontent">

            <div class="idea" id="d1">
                <h2>領先的 Web 技術教程 - 所有免費</h2>
                <p>在 w3school,你能夠找到你所須要的全部的網站建設教程。</p>
                <p>從基礎的 HTML 到 CSS,乃至進階的 XML、SQL、JS、PHP 和 ASP.NET。</p>
                <p><strong>從左側的菜單選擇你須要的教程!</strong></p>
            </div>

            <div class="idea" id="d2">
                <h3>完整的網站技術參考手冊</h3>
                <p>咱們的參考手冊涵蓋了網站技術的方方面面。</p>
                <p>其中包括W3C標準技術:HTML、CSS、XML 。以及其餘技術,諸如 JavaScript、PHP、SQL 等。</p>
            </div>

            <div class="idea" id="d3">
                <h3>在線實例測試工具</h3>
                <p>在 w3school,咱們提供上千個實例。</p>
                <p>經過使用咱們的在線編輯器,你能夠編輯這些例子,並對代碼進行實驗。</p>
            </div>

            <div class="idea" id="d4">
                <h3>快捷易懂的學習方式</h3>
                <p>一寸光陰一寸金,所以,咱們爲您提供快捷易懂的學習內容。</p>
                <p>在這裏,您能夠經過一種易懂的便利的模式得到您須要的任何知識。</p>
            </div>


            <div class="idea" id="d5">
                <h3>從何入手?</h3>
                <p>什麼是一個Web建設者須要學習的知識呢?</p>
                <p>W3School將爲您回答這個問題,在您成爲專業 Web 開發者的路上助一臂之力。</p>
                <p>若是您是初學者,請您閱讀《<a href="/web/index.asp" title="網站構建初級教程">網站構建初級教程</a>》。</p>
                <p>若是您是開發者,請您閱讀《<a href="/site/index.asp" title="網站構建">網站構建高級教程</a>》。</p>
            </div>


            <div class="idea" id="d6">
                <h3>W3School 新聞</h3>

                <p>
                    <a href="/cssref/index.asp" title="CSS 參考手冊">CSS3 參考手冊</a> 已上線,敬請批評指正。
                </p>
            </div>


            <div class="idea" id="d7">
                <h3>W3School 更新信息</h3>

                <p>
                    <a href="/php/php_ref_calendar.asp" title="PHP Calendar 函數">參考手冊:PHP Calendar 函數</a>
                    &nbsp;&nbsp;&nbsp;
                    <a href="/php/php_ref_date.asp" title="PHP Date / Time 函數">參考手冊:PHP Date / Time 函數</a>
                    &nbsp;&nbsp;&nbsp;
                    <a href="/html/index.asp" title="HTML 教程">教程:HTML 教程</a>
                </p>

            </div>


            <div id="d8">
                <h3>W3School 友情連接</h3>
                <p class="partner">
                    <a target="_blank" href="http://mozilla.com.cn/">Firefox 中文社區</a> &nbsp;&nbsp;&nbsp;
                    <a target="_blank" href="http://www.w3ctech.com/">w3ctech</a> &nbsp;&nbsp;&nbsp;
                    <a target="_blank" href="http://wetest.qq.com/?from=links_w3school">WeTest騰訊質量開放平臺</a> &nbsp;&nbsp;&nbsp;
                </p>
            </div>


            <div id="d9">
                <h3>新浪微博</h3>
                <p><a target="_blank" href="http://weibo.com/w3schoolcomcn">W3School 官方微博</a></p>
            </div>


            <div id="d10">
                <h3>微信公衆號</h3>
                <p>W3School 官方服務號</p>
            </div>

        </div>


        <div id="sidebar">

            <h2>參考手冊</h2>
            <ul>
                <li><a href="/tags/index.asp" title="HTML 參考手冊">HTML/HTML5 標籤</a></li>
                <li><a href="/tags/html_ref_colornames.asp" title="HTML 顏色名">HTML 顏色</a></li>
                <li><a href="/cssref/index.asp" title="CSS 參考手冊">CSS 1,2,3</a></li>
                <li><a href="/jsref/index.asp" title="JavaScript 參考手冊">JavaScript</a></li>
                <li><a href="/jsref/index.asp" title="HTML DOM 參考手冊">HTML DOM</a></li>
                <li><a href="/jquery/jquery_reference.asp" title="jQuery 參考手冊">jQuery</a></li>
                <li><a href="/jquerymobile/jquerymobile_ref_data.asp" title="jQuery Mobile 參考手冊">jQuery Mobile</a></li>
                <li><a href="/vbscript/vbscript_ref_functions.asp" title="VBScript 函數">VBScript</a></li>
                <li><a href="/asp/asp_ref.asp" title="ASP 參考手冊">ASP</a></li>
                <li><a href="/ado/ado_reference.asp" title="ADO 參考手冊">ADO</a></li>
                <li><a href="/aspnet/aspnet_reference.asp" title="ASP.NET 參考手冊">ASP.NET</a></li>
                <li><a href="/php/php_ref.asp" title="PHP 參考手冊">PHP 5.1</a></li>
                <li><a href="/xmldom/xmldom_reference.asp" title="XML DOM 參考手冊">XML DOM</a></li>
                <li><a href="/xsl/xsl_w3celementref.asp" title="XSLT 元素參考手冊">XSLT 1.0</a></li>
                <li><a href="/xpath/xpath_functions.asp" title="XPath、XQuery 以及 XSLT 函數">XPath 2.0</a></li>
                <li><a href="/xslfo/xslfo_reference.asp" title="XSL-FO 參考手冊">XSL-FO</a></li>
                <li><a href="/wap/wml_reference.asp" title="WML 參考手冊">WML 1.1</a></li>
                <li><a href="/glossary/index.asp" title="W3C 術語表和詞典">W3C 術語表</a></li>
            </ul>

            <h2>字符集</h2>
            <ul>
                <li><a href="/tags/html_ref_charactersets.asp" title="HTML 字符集">HTML 字符集</a></li>
                <li><a href="/tags/html_ref_ascii.asp" title="HTML ASCII 參考手冊">HTML ASCII</a></li>
                <li><a href="/tags/html_ref_entities.html" title="HTML ISO-8859-1 參考手冊">HTML ISO-8859-1</a></li>
                <li><a href="/tags/html_ref_symbols.html" title="HTML 4.01 符號實體">HTML 符號</a></li>
            </ul>

            <h2>實例/案例</h2>
            <ul>
                <li><a href="/example/html_examples.asp">HTML 實例</a></li>
                <li><a href="/example/csse_examples.asp">CSS 實例</a></li>
                <li><a href="/example/xmle_examples.asp">XML 實例</a></li>
                <li><a href="/example/jseg_examples.asp">JavaScript 實例</a></li>
                <li><a href="/example/jsrf_examples.asp">JavaScript 對象實例</a></li>
                <li><a href="/example/hdom_examples.asp">HTML DOM 實例</a></li>
                <li><a href="/jquery/jquery_examples.asp">jQuery 實例</a></li>
                <li><a href="/jquerymobile/jquerymobile_examples.asp">jQuery Mobile 實例</a></li>
                <li><a href="/example/xdom_examples.asp">XML DOM 實例</a></li>
                <li><a href="/example/dhtm_examples.asp">DHTML 實例</a></li>
                <li><a href="/example/ajax_examples.asp">AJAX 實例</a></li>
                <li><a href="/example/vbst_examples.asp">VBScript 實例</a></li>
                <li><a href="/example/aspe_examples.asp">ASP 實例</a></li>
                <li><a href="/example/adoe_examples.asp">ADO 實例</a></li>
                <li><a href="/svg/svg_examples.asp">SVG 實例</a></li>
                <li><a href="/wap/wap_demo.asp" title="WAP 演示">WAP 實例</a></li>
            </ul>

            <h2>測驗/考試</h2>
            <ul>
                <li><a href="/html/html_quiz.asp">HTML 測驗</a></li>
                <li><a href="/html5/html5_quiz.asp">HTML5 測驗</a></li>
                <li><a href="/xhtml/xhtml_quiz.asp">XHTML 測驗</a></li>
                <li><a href="/css/css_quiz.asp">CSS 測驗</a></li>
                <li><a href="/xml/xml_quiz.asp">XML 測驗</a></li>
                <li><a href="/js/js_quiz.asp">JavaScript 測驗</a></li>
                <li><a href="/jquery/jquery_quiz.asp">jQuery 測驗</a></li>
                <li><a href="/sql/sql_quiz.asp">SQL 測驗</a></li>
                <li><a href="/asp/asp_quiz.asp">ASP 測驗</a></li>
                <li><a href="/php/php_quiz.asp">PHP 測驗</a></li>
            </ul>

            <h2>代碼驗證</h2>
            <ul>
                <li><a href="/site/site_validate.asp" title="網頁驗證">驗證HTML</a></li>
                <li><a href="/site/site_validate.asp" title="網頁驗證">驗證CSS</a></li>
                <li><a href="/site/site_validate.asp" title="網頁驗證">驗證XHTML</a></li>
                <li><a href="/site/site_validate.asp" title="網頁驗證">驗證XML</a></li>
                <li><a href="/site/site_validate.asp" title="網頁驗證">驗證WML</a></li>
            </ul>

        </div>



        <div id="footer">
            <p id="p1">
                W3School 簡體中文版提供的內容僅用於培訓和測試,不保證內容的正確性。經過使用本站內容隨之而來的風險與本站無關。
            </p>

            <p id="p2">
                <a href="/about/about_use.asp" title="關於使用">使用條款</a>和<a href="/about/about_privacy.asp" title="關於隱私">隱私條款</a>。版權全部,保留一切權利。
                贊助商:<a target="_blank" href="http://www.ykinvestment.com/" title="上海贏科投資有限公司">上海贏科投資有限公司</a>。
                <a target="_blank" href="http://www.miitbeian.gov.cn/">蒙ICP備06004630號</a>
            </p>
        </div>

    </div>
</body>
</html>
'''
soup = BeautifulSoup(f,'lxml')
##print(soup.prettify())      #把要解析的字符串以標準縮進輸出
#soup.blablabla只能匹配第一個結果
print(Fore.WHITE + Back.MAGENTA + soup.title.string)

#attrs獲取屬性,結果爲字典, eg:  soup.blablabal.attrs
print(soup.link.attrs)
#獲取具體屬性記得[]內加'',有的返回str,有的list,決定於屬性是否惟一
print(soup.link.attrs['rel'])
#簡寫不加attrs直接[]結果相同
print(soup.link['rel'])

#嵌套選擇       eg:     soup.節點.節點.節點.節點
print(soup.head.title)

#關聯選擇
print(soup.div.content)

#find_all(name,attrs,recursive,text,**kwargs)
相關文章
相關標籤/搜索