- 火車採集器(LocoySpider)
| 軟件大小:21.48MB | 軟件類別:國產軟件 | 其它分類 |
| 軟件語言:簡體中文 | 運行環境:Win9X/2000/XP/2003/Vista |
軟件評級:![]() | 更新時間:2008-8-8 11:44:26 |
| 軟件授權: | 插件情況:![]() |
| 相關鏈接:Home Page | 演示地址:Demo Url |
|
|
|
- 軟件介紹
1、重寫的自動更新模塊,新增自動更新調度管理器,可計算各任務下次啟動時間,管理更加直觀
2、重寫的任務運行管理器,不再採集定時刷新的方式管理任務隊列
3、更新了中文分詞模塊,加入了對詞性和詞頻的分析,使提取的關鍵字更加準確,並可以挂接用戶詞庫
4、修改了多頁設置內在默認頁採集得到地址不再使用正則規則,而使用[參數]標簽組合結果的簡單方法設置
5、WEB發布模塊發布地址和引用地址內加入了隨機登錄值標簽的支持
6、修正了時間轉換標簽已存在的bug,支持更多種時間格式的轉換
7、修復了數據庫入庫超過兩次後出現索引超出範圍。必須為非負值並小於集合大小的錯誤
8、修正了隨機登錄值標簽UrlEncode不成功的問題
9、去除了任務完成後的提示音
10、去除了係統設置內標題內容標簽是否不得為空的設置,改為可以對任意標簽進行設置
11、加入了對更多種下載文件格式的支持
12、修改單個標簽可設置是否在分頁中匹配的功能,分頁與多頁不再衝突,至此可以完美採集論壇的所有樓層及分頁回復
新增功能 (部分功能分配到免費版及個人版)
1、加入了對Sqlite數據庫的支持,本地數據採用Sqlite保存,相比Access性能得到巨大提高
2、加入了外部編程接口,用戶可以火車採集器內使用自己編寫的php接口文件處理標簽數據
3、加入了可視化編輯器及高亮文本編輯框,對本地數據的後期編輯更加快速和直觀
4、加入了內置FTP上傳文件的功能,特別在自動更新時保證下載的文件同步更新到服務器
5、加入了對採集內容簡體轉繁體,繁體轉簡體及火星文之間的轉換的功能
6、加入了對單個標簽可設置必須包含不得包含,採集結果是否允許為空的設置,使採集結果更加精確
7、加入了對單個標簽是否補全相對網址的功能
8、加入了對需要POST數據才能採集的列表類的網站的支持,實例中已能完美採集51job.com
9、加入了採集時可選是否檢測重復網址的功能,增加採集的速度
10、加入了發布時可選隨機發布的功能,實現文章的亂序排列
11、加入了分詞測試工具、翻譯測試工具
12、加入了自動識別網頁編碼和自己加載本地登錄信息的功能,使設置更加簡單,可實現採集多編碼的多頁網頁
2、重寫的任務運行管理器,不再採集定時刷新的方式管理任務隊列
3、更新了中文分詞模塊,加入了對詞性和詞頻的分析,使提取的關鍵字更加準確,並可以挂接用戶詞庫
4、修改了多頁設置內在默認頁採集得到地址不再使用正則規則,而使用[參數]標簽組合結果的簡單方法設置
5、WEB發布模塊發布地址和引用地址內加入了隨機登錄值標簽的支持
6、修正了時間轉換標簽已存在的bug,支持更多種時間格式的轉換
7、修復了數據庫入庫超過兩次後出現索引超出範圍。必須為非負值並小於集合大小的錯誤
8、修正了隨機登錄值標簽UrlEncode不成功的問題
9、去除了任務完成後的提示音
10、去除了係統設置內標題內容標簽是否不得為空的設置,改為可以對任意標簽進行設置
11、加入了對更多種下載文件格式的支持
12、修改單個標簽可設置是否在分頁中匹配的功能,分頁與多頁不再衝突,至此可以完美採集論壇的所有樓層及分頁回復
新增功能 (部分功能分配到免費版及個人版)
1、加入了對Sqlite數據庫的支持,本地數據採用Sqlite保存,相比Access性能得到巨大提高
2、加入了外部編程接口,用戶可以火車採集器內使用自己編寫的php接口文件處理標簽數據
3、加入了可視化編輯器及高亮文本編輯框,對本地數據的後期編輯更加快速和直觀
4、加入了內置FTP上傳文件的功能,特別在自動更新時保證下載的文件同步更新到服務器
5、加入了對採集內容簡體轉繁體,繁體轉簡體及火星文之間的轉換的功能
6、加入了對單個標簽可設置必須包含不得包含,採集結果是否允許為空的設置,使採集結果更加精確
7、加入了對單個標簽是否補全相對網址的功能
8、加入了對需要POST數據才能採集的列表類的網站的支持,實例中已能完美採集51job.com
9、加入了採集時可選是否檢測重復網址的功能,增加採集的速度
10、加入了發布時可選隨機發布的功能,實現文章的亂序排列
11、加入了分詞測試工具、翻譯測試工具
12、加入了自動識別網頁編碼和自己加載本地登錄信息的功能,使設置更加簡單,可實現採集多編碼的多頁網頁
- 火車採集器(LocoySpider)下載地址(已被下載
次)





