網友評分: 9.4分
Beautiful Soup是款專門針對python推出的HTML/XML解析工具。它具有強大的解析功能,可以方便的處理不規范標記并生成剖析樹,自動將輸入文檔轉換成Unicode編碼,適用于抓取網站數據,大大提高工作效率。
1.Beautiful Soup提供了一些簡單的方法和Python術語,用于檢索和修改語法樹:一個用于解析文檔并提取相關信息的工具包。這樣你寫一個應用不需要寫很多代碼。
2.Beautiful Soup自動將輸入文檔轉換為Unicode編碼,并將輸出文檔轉化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒有指出其編碼并且Beautiful Soup無法自動檢測到,這時你需要指出原來的編碼方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來換取靈活性。
1、解壓文件
將下載得到的壓縮包解壓到任意文件夾,路徑不含中文
2、打開cmd命令提示符
win+r,輸入cmd,回車
進入解壓后的目錄,我這里是C:\Python27\bs4\beautifulsoup4-4.3.2
所以使用
cd C:\Python27\bs4\beautifulsoup4-4.3.2
然后
setup.py build
接著
setup.py install
完成安裝
3、測試
python
import bs4
沒有提示錯誤,成功!