上一主题: 在 SharePoint 中验证爬网程序数据下一主题: 使用 SDK 接口新建自定义适配器


故障排除

Crawler 曲面组件具有一组通常的日志文件:

  1. 如果希望为联合搜索启用调试,请导航到以下 CA SDM 目录:
    $NX_ROOT\bopcfg\www\CATALINA_BASE_FS\webapps\cafedsearch\WEB-INF
    
  2. 打开 log4j.properties 文件并将信息改为调试模式。
  3. 要对 fscrawl 启用调试,请导航到以下 CA SDM 目录:
    $NX_ROOT\bopcfg\www\CATALINA_BASE_FS\webapps\fscrawl\WEB-INF
    
  4. 打开 log4j.properties 文件并将信息改为调试模式。
  5. 要更正在配置 SharePoint Crawler 曲面组件时遇到的语法错误,请从 CA SDM 目录打开 jfscrawl 日志文件:
    $NX_ROOT\logs 目录
    
  6. 如果找到任何语法错误,请更正 XML 文件并重新启动联合搜索 Tomcat。日志位于
    $NX_ROOT\logs\jfscrawl.log 
    

    例如,如果 <meta_data> 标记被意外损坏,则日志将指出以下错误:

    08/06 15:43:52.624 [pool-2-thread-1] ERROR FSCrawlApplicationListener 302 XmlException::Problem loading config_file::C:\PROGRA~2\CA\SERVIC~1\bopcfg\www\CATALINA_BASE_FS\webapps\fscrawl\WEB-INF\crawler_surface_config.xml:274:8: error: </meta_dataxxxxx> does not close tag <meta_data>
    
    08/06 15:43:52.625 [pool-2-thread-1] ERROR FSCrawlApplicationListener 144 crawler_surface_config.xml could not be loaded, cannot read.
    
  7. 如果没有语法错误,将显示以下消息:
    08/06 15:46:27.924 [pool-2-thread-1] INFO FSCrawlApplicationListener 58 fscrawl context had been loaded successfully.
    
  8. 更正在尝试访问 CA SDM 后才显示的任何其他错误。

    例如,在 crawler_surface_config.xml 的 <additional_attributes_to_index> 元素中,请求了为突发事件提供未知属性 xxxxx。Crawler 曲面组件应用程序没有检测到此错误。但是,当 Crawler 曲面组件将此请求发送到对象管理器时,将检测到此错误并将其记录在 stdlog.x 文件中,如下所示:

    08/06 15:51:23.92 SDMSERVER domsrvr 10860 ERROR domset.c 8049 Unknown attribute "xxxxx" requested from domset MLIST_STATIC of factory
    
  9. 使用 bop_sinfo -d 命令来解决错误。
  10. 修改 crawler_surface_config.xml 文件。
  11. 重新启动联合搜索 Tomcat。

    已配置 Crawler 曲面组件对象,且没有任何错误。