上一主题: 在 SharePoint 中创建内容源下一主题: 在 SharePoint 中启动爬网


创建爬网规则

爬网规则定义对 SharePoint Web Crawler 曲面组件 URL 进行爬网的方式。定义以下爬网规则:

遵循这些步骤:

  1. 登录到 MS SharePoint 管理中心控制台。
  2. 单击“管理服务应用程序”、“搜索服务应用程序”。
  3. 单击“爬网规则”。新建爬网规则。
  4. 在浏览器中输入以下 URL:
    http:// <sdmhostname>:<FS_Tomcat_Port>/fscrawl/*farm=<farm-name>*
    

    重要信息! Crawler 曲面组件 URL 区分大小写。SharePoint 将大写主机名更改为小写形式。对于 SharePoint 2010,请确保选中“区分大小写”复选框。

  5. 选择“包含此路径中的所有项目”以配置爬网程序。
  6. 选择“对复杂 URL (包含问号 ? 的 URL)进行爬网”。
  7. 选择“指定其他内容访问帐户”。
  8. 输入 Crawler 曲面组件的 CA SDM 用户帐户名和密码。
  9. 为 CA SDM 附件创建第二个爬网规则:
    http://<sdmhostname>:<FS_TOMCAT_PORT>/CAisd/*
    
  10. 指定默认的身份验证:

    注意:Crawler 曲面组件使用基本身份验证。CA SDM 存储库后台进程使用 SharePoint 不直接支持的专有 BOPSID 安全性。指定任何用户 ID 和密码,或者选择“匿名访问”(如果在您的 SharePoint 版本中该选项可用)。

    已创建 Microsoft SharePoint 爬网规则。