要設定此內容蒐集程式以避免將不需要的網頁匯入至入口網站:
預設情況下,此內容蒐集程式遵循 Web 伺服器關於哪些頁面可能對自動蒐集程式具有價值的建議。如果要略過這些建議,請清除遵循目標網站的自動排除通訊協定核取方塊。
一般情況下,這些建議有助於限制將不需要的內容匯入到入口網站中。但是,一些網站會提出非常嚴格的建議。如果內容蒐集程式未從網站匯入任何內容,請嘗試關閉此選項。
根據預設,內容蒐集程式會將匯入網頁的 URL 按來源網站的大小寫保存。要將 URL 變更為小寫,請選取將所有 URL 轉換為小寫。
要避免從某網站區域匯入內容或避免匯入特定頁面﹕
若要指定避免的區域,請按一下 新增排除篩選器,然後在文字方塊中,鍵入想要避免的網站區域的 URL。
您可以使用萬用字元標記 (*) 來排除大範圍的區域。例如,要避免蒐集某個網站的銷售資訊,可以鍵入 http://mycompany.com*sales。如此一來,此蒐集程式便不會匯入在 URL 任意位置中含有 "sales" 字樣的任何 mycompany.com 網頁。
注意:文字的任一端都可使用萬用字元。例如,如果您鍵入 sales,蒐集程式將不會從目標 URL 任何位置有 "sales" 字樣的 任何網站匯入任何頁面。
重要:如果您列出排除項目和包含項目 (步驟 5 所述),則排除項目只適用於包含的頁面。例如,如果您排除了 sales 而包含了 http://mycompany.com,除了 URL 任何位置有 "sales" 字樣的頁面以外,您的蒐集程式會從 http://mycompany.com 匯入所有頁面。
要移除排除,請選取排除並按一下 。
要選取或清除所有排除核取方塊,請選取或清除排除左邊的方塊。
預設情況下,此蒐集程式不蒐集或匯入排除中指定的任何頁面。如果內容蒐集程式要透過已排除頁面上的連結進入不被排除且應匯入的頁面,請選擇蒐集排除的頁面但不匯入。
要將蒐集限制為網站的區域或特定頁面以內:
若要指定此內容蒐集程式要蒐集的區域,請按一下 新增包含篩選器,然後在文字方塊中鍵入要蒐集的限定網站 URL。因為網站會包含其他網站的連結,所以您可以使用包含讓內容蒐集程式維持在特定網站上。若要避免蒐集其他網站,請將想要蒐集的網站基本 URL 新增至包含清單中,例如,http://mycompany.com。
您可以使用萬用字元標記 (*),讓包含範圍更為廣泛。例如,如果只想蒐集 Single Sign-on (SSO) 資訊,您可以鍵入 http://mycompany.com*sso。如此一來,此內容蒐集程式只會匯入 URL 任何位置有 "sso" 字樣的 mycompany.com 頁面。
注意:文字的任一端都可以使用萬用字元。例如,如果鍵入 sso,內容蒐集程式將會匯入目標 URL 任何位置有 "sso" 字樣的任何網站可存取的所有頁面。
重要事項:如果您列出包含項目和排除項目,則排除項目只會套用於包含的頁面。例如,如果包含 http://mycompany.com,但排除 sso,則除了 URL 任何位置有 "sso" 的網頁之外,您的內容蒐集程式會匯入 http://mycompany.com 所有的頁面。
要移除包含,請選取包含並按一下 。
要選取或清除所有包含核取方塊,請選取或清除包含左邊的方塊。
要顯示與此說明主題相關的頁面: