用AI技术解构金融业务文档 “庖丁科技”获得Pre-A轮融资

2018-1-22 17:36| 发布者: 热腾网| 查看: 995| 评论: 0

摘要: 原标题：用AI技术解构金融业务文档 “庖丁科技”获得Pre-A轮融资金融是个文档密集型行业，基金、券商、会计师事务所等机构都需要进行大量文件的撰写、检测和复盘。2017年8月，庖丁科技获得Pre-A轮 ...

金融是个文档密集型行业，基金、券商、会计师事务所等机构都需要进行大量文件的撰写、检测和复盘。2017年8月，庖丁科技获得Pre-A轮融资，该公司推出金融文档结构化应用，希望通过AI技术解构文本，最终实现计算机对文本内容的智能甄别、关联、分析和预判，推动金融机构业务线的自动化和智能化。

金融行业的高风险性，要求其文档准确、严谨并且完整。拿IPO申请书来说，文档中的某个细微错误，轻会带来经济赔偿，重会导致上市失败。因此，为了将文件的错误率降到最低，相关机构需要大量经过训练的金融人才。不过，即使经过训练，在这种程式化的工作上，因为精力有限，人不免还是会有很多错误。

目前，庖丁团队大概有50人，技术占比超过95%。庖丁科技创始人、董事长林得苗在清华大学计算机系硕士毕业后，曾在惠普中国实验室担任研究员；联合创始人罗平现任中科院计算技术研究所博士生导师；联合创始人高大光曾供职于加拿大鲍尔集团、香港联交所等公司。

庖丁科技推出的金融文档结构化应用，是在数据资源的基础上，通过深度学习，让计算机读懂文档语义，实现智能复核、甄别等。其核心产品AutoDoc的主要功能是金融文档内容及数据复核。用户上传需要复核的文档后，机器经过自动解析和比对，会标注出数据不一致的地方。

比如，其AI模型可以研读沪深证券交易所上市公司披露的年度报告，进行遗失披露、不及时披露、补充更正等问题的甄别。目前其产品只需要20分钟，就可以生成准确率达99.9%的纠错报告。

在这个过程中，为了让计算机读懂几百页的PDF文件，需要经过自然语言结构化、表格语意数字化等训练。其中的关键在于，让AI理解文字和表格等自然语言，以及其背后的语意。比如，表格二维布局中不同数字的内在关系；同一个指标在不同报表中的不同含义等。这些都是AI需要学会的部分。

目前，To B是庖丁科技最重要的商业模式，国内外金融机构和金融监管机构是其最主要的合作对象。考虑到用户需求，庖丁科技和B端用户有多种合作模式，包括按次付费和按软件付费。

公司会到相关机构进行系统部署，帮助其进行后续升级等。考虑到数据隐私问题和AI系统的反馈需求，券商等B端客户或给庖丁科技提供脱敏过的数据，而非系统中的完整数据。除了To B模式，公司业务还面向C端：目前，所有用户都可以在其网站上传文档，进行免费试用产品。在公司CEO高大光看来，这是公司教育客户的重要策略。

编辑 | 杨茅

优质项目"融资首发绿色通道"：创业者请加微信yangmao-71，务必注明项目名称；或发送BP至xueting@pencilnews.cn。

如需转载文章请联系铅笔道微信客服号：铅笔道大芯芯（微信id：qianbidao2017）获取授权资质，否则我们将依法追究相关责任。