說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
一個大型的資訊網站在發表文章時,如果是一條條的文章網上發,這不僅浪費時間,效率還不高,這時為了提高更新網站的效率,就出現了火車頭采集器,可是火車頭采集規則怎么寫呢?接下來就由小編來詳細的介紹吧。
火車頭采集規則寫法介紹
步驟一:新建一個文章采集節點
登錄后臺,依次點擊 采集>>采集節點管理>>增加新節點>>選擇普通文章>>確定
步驟二 :填寫采集列表規則
1.節點名稱:隨便(注意你要能分清哦,因為節點多了的話,有可能會搞得自己混亂)
2.目標頁面編碼:看目標頁面的編碼
3.匹配網址:去到采集目標列表頁面,查看它的列表規則!比如說很多網站的列表的第一面跟其它內頁是有很大的差別的,所以我一般不采集目標列表的第一頁!
最好是從第二頁開始(雖然可以找出第一頁,但很多的網站是根本沒第一頁的,所以,這里就不說怎么找第一頁了)
4.區域結束的HTML:在采集目標列表頁打開源代碼!在要采集的文章標題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標簽!
寫好了,點擊保存信息并進入下一步!如果寫正確了規則的話,那這些就會出現一個有內容的網址獲取規則測試
再按下一步!進入填寫采集內容規則
步驟三:采集內容規則
1.文章標題:在文章標題前后找兩個標簽,能識別出標題的!
2.文章內容:在文章內容前后找兩個標簽,能識別出內容的!我采集的網站的文章內容前后唯一標簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點擊保存配置并預覽,如果前面的列表規則跟內容規則都寫對了的話,那現在就會預覽到內容了!
點擊僅保存,如果你要馬上采集的話,也可以點擊隔壁的保存并馬上采集!
火車頭采集規則導入方法
1.導入規則方法一
右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規則”),在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。
2.導入規則方法二
也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導入任務至該分組” 在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。
3.導入分組規則
如果你手上的規則文件后綴名為“.lgrp”,那么你需要通過菜單或右鍵快捷菜單選擇“導入分組規則”,而不是“導入任務至該分組”。
好了,有關火車頭采集規則寫法就介紹到這里了,當然想要掌握這個寫法的可不是馬上就能完成的事情,是需要在不斷的實踐中去掌握和運用的,所以想要掌握格則寫法的,現在就開始練習吧。如果想了解更多的內容,歡迎關注我們文軍營銷的官網。
推薦閱讀
火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點擊右下角的“網址采集測試”, 2測試后,如果網址是這么顯示出來的,那就是采集成功了。點擊其中一個網址左邊的“+”符號,可以看到該欄目頁面采集到的內容。 火車頭采集器教程之數據采集步驟 火車采集器采集數據是分成兩個步驟的,一是采集數據,二是發布數據。這兩個過程是可以分開的。 1、采集數據,這個包括采集...火車頭采集圖片方法 火車頭采集圖片步驟是什么 | 文軍營銷言歸正傳,火車頭使用的步驟是:新建站點—新建任務—填寫你要采集的網站文章列表—點下面的開始測試網址—如果有采集到很多文章,看各個地址相同部分(如system/2012/03/07),點返回修改,把system/2012/03/07這部分加到“文章內容必須包含”那里,再測試一下,就可以采集到3月7日的文章地址了—前面準備好網址后接下來...火車頭采集器 火車頭采集器是什么 | 文軍營銷采集器將數據發送給網站后臺程序,由網站后臺程序去處理數據通常后臺程序講數據存入網站數據庫中。 方式二:保存為本地文件 這種方式可以將采集的數據發布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式。 方式三:導入到自定義數據庫 這種方式可以通過采集器連接到其他數據庫從而將采集的數據從軟件內置數據...火車頭采集器視頻教程大全 火車頭采集器v9使用視頻教程 | 文軍營銷好好填寫任務列表的規則。下面教大家如何填寫 END 火車頭采集器教程步驟(4)填寫采集列表頁的規則 1 找到頂頭的“起始網址”,可先不填。可以在右邊點擊”向導添加”里面填寫,如圖: 2 點擊“批量網址”,如下圖: 3 (1)在“地址格式”空白欄里,復制想要采集的列表欄目網址 ,(先去對方網站某個欄目看 ...火車頭采集規則寫法介紹 火車頭采集規則如何導入? | 文軍營銷火車頭采集規則導入方法 1.導入規則方法一 右鍵點擊剛才新建的分組,選擇“導入任務至該分組”(記住:不是“導入分組規則”),在彈出的對話框中選擇已經采集規則文件(后綴為.ljobx)。 2.導入規則方法二 也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導入任務至該分組” 在彈出的對話框中選擇已經采集規則文件...
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732