跳到主要内容

发送文件

发送文件进行标准分析

要开始文件分析,请使用 multipart/form-data 格式向 /document 端点发送 POST 请求。

端点:https://api.caas.qitech.app/document_analysis/document

请求格式

请求必须以 multipart/form-data 格式发送,包含数据字段和文件字段。分析所需的必填字段为 iddocument_analysis_typedocument_bytes

请求示例:

curl -X POST "https://api.caas.qitech.app/document_analysis/document" \
-H "Authorization: SUA_CHAVE_API" \
-H "Content-Type: multipart/form-data" \
-F "id=solicitacao-abc-12345" \
-F "document_analysis_type=proof_of_address" \
-F "document_bytes=@/caminho/para/seu/comprovante.pdf"

发送属性说明

属性描述
id(必填)由您提供的请求唯一标识符。此 ID 可在以后用于检索分析结果。
document_analysis_type(必填)一个字符串,指定要对文档执行的分析类型。支持的类型请参见下表。
document_bytes(必填)待分析的文档文件。必须作为 multipart 请求体中的文件发送。注意:请勿将此字段作为 base64 编码字符串发送。
async(可选,默认=false)一个布尔值(true 或 false),定义处理模式。
- false(同步):API 将尝试处理文档并在同一请求中返回结果。
- true(异步):API 将确认接收并在后台处理。结果将通过 webhook 发送到预先配置的 URL(更多信息请参见关于 webhooks 的部分)。
注意

async 字段应用于指示异步请求。同步请求应仅用于小型文档和需要立即响应的快速分析。如果请求超过 30 秒,将自动重定向到队列,返回状态为 202 Accepted,分析结果将发送到预先配置的 webhook URL(更多信息请参见关于 webhooks 的部分)。

支持的分析类型

document_analysis_type 字段确定将应用于您文档的数据提取模型。以下是目前支持的类型。

分析类型文档类型描述
company_statute_default公司章程/合同执行公司章程的基本提取和验证。提取公司和股东的一般信息。
company_statute_credit_assignment公司章程/合同执行公司章程的高级提取,包括验证签署信贷转让合同的权限。
proof_of_address_default居住证明(水电费账单、燃气费、网费、政府信函、声明等)提取并验证居住证明信息,如邮政编码、完整地址、姓名和日期。
invoice发票、DANFEs提取发票中的关键信息,包括供应商/客户详情、总额和项目。
bankslip银行付款单提取银行付款单信息,如受益人、金额和到期日。
ccb_default银行信贷票据(CCBs)提取银行信贷票据的数据。

对于此处未列出的分析类型,请通过 suporte.caas@qitech.com.br 联系我们的支持团队,咨询自定义实现。

响应

成功响应(200 OK

如果同步分析中的文档处理成功,API 将返回 HTTP 200 OK 状态和包含提取数据的 JSON 对象。此 JSON 对象的结构将根据请求的 document_analysis_type 而有所不同。如果请求超时,API 将返回 HTTP 202 Accepted 状态,请求将异步处理。稍后可以使用 GET 请求检索文档分析,如下所述

接受响应(202 OK

如果文档以异步方式处理,API 将返回 HTTP 202 Accepted 状态,请求将异步处理。稍后可以使用 GET 请求检索文档分析,如下所述

错误响应(4xx

如果请求或文档存在问题,API 将返回 4xx 状态码和描述错误的 JSON 正文。

错误代码参考

以下表格列出了 API 返回的所有可能的错误代码。您可以使用这些代码在应用程序中实现健壮的错误处理。

类别 1:请求错误(DOC001xx)

代码标题描述
DOC00100Missing required field请求在 multipart/form-data 正文中不包含必填字段。
DOC00101Invalid field lengthform-data 字段中某个值的长度无效。
DOC00102Invalid content type at request请求的 Content-Type 头不是 multipart/form-data
DOC00103Invalid field at request请求在 form-data 正文中包含意外或无效字段。

类别 2:文件处理错误(DOC002xx)

当发送的文件本身存在阻止处理的问题时,会发生这些错误。

代码标题描述
DOC00200Invalid Document Analysis Typedocument_analysis_type 对发送的文档无效。(例如:对水电费账单使用 company_statute_default 分析。)
DOC00201Invalid File Size发送的文档大小超过允许的最大限制。
DOC00202Invalid File Type由于类型或格式不一致,文件无法处理(例如:发送了一个 .jpg 文件,但类型为 application/pdf)。
DOC00203PDF exceeds page limit提供的 PDF 文件包含的页数超过了处理允许的最大限制(当前限制为 200 页)。

类别 3:文档分析错误(DOC003xx)

这些错误发生在数据提取和分析阶段,即文件成功打开之后。

代码标题描述
DOC00300Missing Information文档不包含完成分析所需的基本信息。
DOC00301Bad Quality文档质量(例如:分辨率、可读性、清晰度)太低,无法准确分析。
DOC00302Invalid Data文档包含不一致或无效的数据(例如:校验和不正确、字段相互矛盾)。
DOC00303Incorrect Document Type文档内容与所选 document_analysis_type 的预期文档类型不符。
DOC00304Invalid PDF File提供的文件不是有效或格式良好的 PDF,无法打开。
DOC00305Password Protected PDF发送的 PDF 已用密码加密,无法处理。
DOC00306Parsing Error无法处理文档分析。

检索文档分析

您可以随时使用其唯一的 id 检索之前提交的文档分析结果。

https://api.caas.qitech.app/document_analysis/document/{document_id}

将 document_id 替换为您发送 POST 请求时使用的相同值。