“在数据成为新型生产要素的当下,文档恰恰就是数据要素的载体。而基于版式文档的数据资源化,是我们这些年来努力的主要方向。”福建福昕软件公司中国区副总经理关鹏在接受记者采访时开门见山。
关鹏介绍,常见文档分为流式文档和版式文档两种,流式文档的典型是word文件,优点在于可编辑;版式文档的典型是PDF/OFD,在显示、打印等方面具有优势。
据统计,版式文档占文档总数的八九成。如何将文档中承载的数据要素进行永续保存和有效利用?又如何实现版式文档的数据资源化,使之变成真正的数据要素?
“掘金”数据要素资源,释放数据要素价值。关鹏认为:“这是和开采金矿一样的过程。”
福昕软件是一家成立于2001年的科技公司,在版式文档软件领域,福昕软件位于全国第一、全球第二。公司软件用户超过7.2亿,遍及世界200多个国家和地区,90%以上营业收入来源于欧美日等海外市场,拥有43项国内外发明专利、129项著作权、95件商标。
十年饮冰,热血未凉。福昕软件在版式文档的赛道上一路领跑,近年来更是在智能文档领域深耕发力。“版式文档并不仅仅是一个办公文档,文档中所蕴含的数据要素资源可以赋能工业、装修、教育等千行百业。”
作为一家总部在福州的软件公司,福昕软件每一届数字中国建设峰会都参加,“出满全勤”。而如何进一步深入研发更强大的应用来“掘金”文档、满足不同产业需求,也是历年参加峰会给福昕研发团队最大的灵感触发。
关鹏分析:“要实现文档数据要素资源化,就必须要能够处理多源异构的数据素材、实现文本的语义解析、开发多样化数据产品。而制定标准,是所有研发工作的基础。”
据介绍,相比于早前流行的版式文档PDF格式,OFD格式是由我国自主研发、自主制定的版式文件格式标准,目前已被广泛应用于政务、税务、商业、工业等领域。
“在数字经济蓬勃发展的当下,数据资产成为重要的生产要素,因此公开、统一的标准对文档数字资产至关重要。为了给制定统一标准作出更大贡献,福昕软件在研发上作了巨大投入。”关鹏说。
据介绍,福昕软件是国际PDF协会主要成员、中国版式文档OFD标准制定成员,参与多项国际、国家标准制定,为国家OFD文档标准贡献了47%的内容。