集简云教学 数据表教学 应用教学 开放平台 用户社区 语聚AI
打开导航
首页 > 应用教学 > 内置应用 > 文档文字提取如何使用?
文档文字提取如何使用?
文档文字提取是集简云的一款内置应用,用于提取某种文档类型中的文字,提取文字大小支持在10M以内,支持多种文档类型进行提取,包括PDF、DOCX、TXT、PPTX、HTML、XLSX等,便于用户更好地使用。

1 功能介绍

 

文档文字提取是集简云的一款内置应用,用于提取某种文档类型中的文字,提取文字大小支持在10M以内,支持多种文档类型进行提取,包括PDF、DOCX、TXT、PPTX、HTML、XLSX等,便于用户更好地使用。
 

2 场景示例

 

企业为招募更多合适的人才,通常会通过BOSS直聘、51Job、智联等多渠道进行招聘。在接收到应聘者发送的简历后,人力资源部门需要对简历进行汇总和分析,提供招聘建议,并将这些信息录入到表单系统,例如明道云中,以便相关招聘部门能够查看和使用。

现在通过集简云搭建一个自动化流程,使用集简云邮件触发获取邮件中的文件,引入ChatGPT进行总结和评估,再同步到明道云,具体的流程图如下:
 

 

但在此流程中,文件转文字的步骤仍然需要人工手动来操作完成,面对大量简历,人工手动同步信息无疑费时费力且易出错,一旦其中的某项信息提取时出现不一致,还需重新核对,增加大量的工作量,同时也会引起不必要的麻烦。

基于此情况,集简云研发了文档文字提取功能,可以实现在短时间内完成大量文件的文字提取,提高工作效率,降低错误率,节省时间和精力。具体流程如下:

 

 

点击图片或文字,立即使用流程模板

3 操作步骤

 

步骤1:邮件触发-当接收到邮件时

步骤2:文档文字提取-提取文档中的文字

步骤3:ChatGPT:对话ChatGPT (原生ChatGPT 3.5 Turbo模型)

步骤4:明道云应用-添加数据到指定工作表

 

其中步骤2-文档文字提取的操作如下:

 

(1)选择执行应用-执行动作:文档文字提取-提取文档中的文字

(2)字段匹配

  • 文档类型:可选择PDF、DOCX、TXT、PPTX、HTML、XLSX等,示例:PDF
  • 文件网站地址:插入变量(文件网址通常包含文件名和路径信息,以文件类型的扩展名结尾。示例:https://test.com/1.pdf. )

 

 

(3) 点击发送数据

 

 

(4)即可得到一条样本数据

 

 

 

4 更多场景示例

 

邮件系统+文档文字提取+OA系统:每当企业人员收到的邮件包含附件文档时,可以通过文档文字提取应用自动提取文档中所需要的文字信息,并通过企业微信/钉钉等OA系统发送消息通知。

表单系统+文档文字提取+表单系统:企业表单系统存储大量简历,常包含PDF、DOCX等多种格式,可以通过文档文字提取应用自动提取候选人文字信息,并将信息再返回至表单系统汇总,便于人事查看。

相关应用 查看更多
应用类型:集简云内置应用
文档文字提取

文档文字提取是集简云的一款内置应用,用于提取某种文档类型中的文字,提取文字大小支持在10M以内,支持多种文档类型进行提取,包括PDF、DOCX、TXT、PPTX等,便于用户更好地使用。

本篇目录
  • 1 功能介绍
  • 2 场景示例
  • 3 操作步骤
  • 4 更多场景示例
  • 相关文章