網友評分: 5分
覃道明網文采集器可以用來采集網絡文章、網絡小說,軟件內置智能高速引擎,采集速度飛快。文章采集到本地后以TXT格式保存,并記錄采集頁序,然后借助覃道明手機電子書助手進行格式處理、去除雜符,最后一鍵生成方便在手機端閱讀的TXT格式電子書。
(1)覃道明網文采集器采集的目標網址必須符合這一規則:目標網址從開始頁,到結束頁,網址的變化只體現在一組(個)數字的遞增或遞減上。例如:
http://www.xxxxx.com/xxxxx/page1.html
http://www.xxxxx.com/xxxxx/page2.html
http://www.xxxxx.com/xxxxx/page3.html
http://www.xxxxx.com/xxxxx/page4.html
http://www.xxxxx.com/xxxxx/page5.html
http://www.xxxxx.com/xxxxx/page6.html
...... ...... ...... ...... ......
http://www.xxxxx.com/xxxxx/page300.html
網址中不變的部分字符“http://www.xxxxx.com/xxxxx/page”與“.html”之間變化的數值以“{變化頁碼}”替換后,就成“網址模型”:http://www.xxxxx.com/xxxxx/page{變化頁碼}.html;上例中,{變化頁碼}開始值:1,{變化頁碼}結束值:300。
?。?)用瀏覽器打開要采集的網頁,查看源代碼,“charset=”之后的值就是“網頁編碼”的值;網頁標題、文章內容的開始值、結束值請如實設置;然后,選擇保存目錄,按下“開始采集”就可以執行采集任務。
(3)如果采集到的文章用于制作TXT格式的電子書,請勾中“記錄頁序”。勾中此項,采集到的文章標題前將自動加入“1---”、“2---”、“3---”...(成書時會自動刪掉),以便生成的書按頁序排序。
當下提醒:該軟件需要在 .Net 3.5 以上環鏡下才能運行,點擊即可下載最新版.Net 3.5==》 .NET Framework 3.5
標簽: 網文采集