金融是个文档密集型行业,基金、券商、会计师事务所等机构都需要进行大量文件的撰写、检测和复盘。2017年8月,庖丁科技获得Pre-A轮融资,该公司推出金融文档结构化应用,希望通过AI技术解构文本,最终实现计算机对文本内容的智能甄别、关联、分析和预判,推动金融机构业务线的自动化和智能化。 金融行业的高风险性,要求其文档准确、严谨并且完整。拿IPO申请书来说,文档中的某个细微错误,轻会带来经济赔偿,重会导致上市失败。因此,为了将文件的错误率降到最低,相关机构需要大量经过训练的金融人才。不过,即使经过训练,在这种程式化的工作上,因为精力有限,人不免还是会有很多错误。 目前,庖丁团队大概有50人,技术占比超过95%。庖丁科技创始人、董事长林得苗在清华大学计算机系硕士毕业后,曾在惠普中国实验室担任研究员;联合创始人罗平现任中科院计算技术研究所博士生导师;联合创始人高大光曾供职于加拿大鲍尔集团、香港联交所等公司。 庖丁科技推出的金融文档结构化应用,是在数据资源的基础上,通过深度学习,让计算机读懂文档语义,实现智能复核、甄别等。其核心产品AutoDoc的主要功能是金融文档内容及数据复核。用户上传需要复核的文档后,机器经过自动解析和比对,会标注出数据不一致的地方。 比如,其AI模型可以研读沪深证券交易所上市公司披露的年度报告,进行遗失披露、不及时披露、补充更正等问题的甄别。目前其产品只需要20分钟,就可以生成准确率达99.9%的纠错报告。 在这个过程中,为了让计算机读懂几百页的PDF文件,需要经过自然语言结构化、表格语意数字化等训练。其中的关键在于,让AI理解文字和表格等自然语言,以及其背后的语意。比如,表格二维布局中不同数字的内在关系;同一个指标在不同报表中的不同含义等。这些都是AI需要学会的部分。 目前,To B是庖丁科技最重要的商业模式,国内外金融机构和金融监管机构是其最主要的合作对象。考虑到用户需求,庖丁科技和B端用户有多种合作模式,包括按次付费和按软件付费。 公司会到相关机构进行系统部署,帮助其进行后续升级等。考虑到数据隐私问题和AI系统的反馈需求,券商等B端客户或给庖丁科技提供脱敏过的数据,而非系统中的完整数据。除了To B模式,公司业务还面向C端:目前,所有用户都可以在其网站上传文档,进行免费试用产品。在公司CEO高大光看来,这是公司教育客户的重要策略。 编辑 | 杨茅 优质项目"融资首发绿色通道":创业者请加微信yangmao-71,务必注明项目名称;或发送BP至xueting@pencilnews.cn。 如需转载文章请联系铅笔道微信客服号:铅笔道大芯芯(微信id:qianbidao2017)获取授权资质,否则我们将依法追究相关责任。 |