新闻发布
立即打印
媒体联络
田园
用友集团 +86 1521 0340 959 tianyuanh@yonyou.com
系列三:人工智能+点聚OFD临床文档中心
2025年10月28日


在之前的讨论中,我们已详细阐述了OFD在医疗领域整合多种异构文档智慧阅读的能力。

今天,我们将进一步回顾OFD的技术特性,以及其在电子病历应用中的独特优势,并在此基础上,简要介绍人工智能与OFD结合在临床文档数据后结构化处理及深度整合利用方面的应用

   
 
   

OFD版式文件结构特点

OFD,全称为开放版式文档(Open Fixed Document),是一种基于XML技术的电子文档格式,具备固定的版式和内容,非常适合长期保存和精确再现。

OFD文件结构的特点主要体现在以下几个方面:

OFD文件具有层次化结构,包括文档、页面和内容元素。它支持丰富的版式控制和嵌入字体及资源,确保文档独立显示的完整性和一致性。

OFD还具有良好的可扩展性,允许自定义元素和属性以适应业务需求。

OFD强调文档安全性和版权保护,提供数字签名和加密机制。  
 

图1 OFD文件的包内结构

综上所述

 

结合电子病历特点,OFD版式文件结构以其层次化、版式控制、资源嵌入、可扩展性以及安全性的特点,成为一种非常适合于电子病历文档或者说全量临床文档长期保存和精确再现的优秀格式。

那么,问题来了


问题一:

临床文档到底包括什么内容?

临床文档,作为交换临床信息的重要工具,记录了患者的病情、治疗过程和医生的诊断。它不仅对治疗方案的制定和跟踪至关重要,还包含了患者的基本信息、病史、检查结果、诊断结论、治疗计划以及外院历史病历等关键信息。这些记录有助于医生间沟通和患者信息的连续性。临床文档的准确性和完整性对医疗质量和患者安全有显著影响。


问题二:

临床文档是否都具备结构化数据的特性?

探讨现代医疗体系中临床文档的重要性。这些文档记录患者健康信息和治疗过程,包含大量结构化和非结构化数据。结构化数据便于计算机处理,但并非所有文档都完全由结构化数据构成,部分文档包含需通过自然语言处理技术提取信息的自由文本。


问题三:

如果有了全量的OFD临床文档,如何通过人工智能实现统一的,全量的结构化数据提取并且实现院内数据字段一致性?

点聚OFD临床文档中心在构建结构化OFD文档方面提供了两种方法,以实现“数显一体”的OFD临床文档。一种方法具有较高的性价比,而另一种则深度融合了大语言模型,应用场景更为广泛。

1

OCR 文字识别+版面数据提取

OCR属于人工智能吗?

要解答这个问题,我们先要明确人工智能(AI)的含义。AI通常指使计算机系统具备执行需人类智能参与的任务的能力,例如视觉感知、语音识别、决策制定及语言翻译等。

OCR技术,即光学字符识别,其功能在于将图片中的文字转换为机器可识别的编码文本,从而在某种程度上模拟了人类阅读与理解文字的能力。


我们来看看基于OCR+OFD的应用场景是什么?

 

图2 带有坐标定位文字层的双层OFD


OCR技术与人工智能紧密相关,尽管应用范围有限,但其价值显著。它能识别文字并精确定位。利用OFD格式的多层结构,OCR技术可将文字信息保存在OFD文件中。


如上期所述,文本定位已实现,全文检索功能也已实现。结构化OFD文档可通过数据套版原生生成,进一步实现结构化检索与利用。


在医学领域,仅全文检索和部分结构化检索不足以满足需求。因此,我们探索了一种简便方法获取双层OFD格式电子病历的结构化内容。点聚OFD临床文档中心尝试通过版面提取技术在双层OFD电子病历上提取结构化数据。


基于医疗文档模板的稳定性,点聚OFD临床文档中心具备元数据管理功能。首先设定医院元数据字段描述,然后利用版面定位技术,将元数据属性以坐标形式嵌入双层OFD文档,实现非结构化数据向结构化数据文档的转换

 

图3 点聚OFD临床文档中心版面机构化数据提取界面


谁说版式文件就一定非得是非结构化文档呢,通过OFD深度技术融合,元数据与OFD文档结构中的数据属性发生关联,从此我们拥有了结构化双层OFD文档。


2

直接应用大型模型 实现更多的智能化应用

若医院已具备GPU计算能力,那么问题将迎刃而解。通过运用大型模型,我们能够赋予自动化处理的能力,将OFD中的文字与图像内容直接输入大型模型中。如此一来,我们能够开发的应用场景将不再局限于结构化处理一个方向,例如:

人工智能+OFD临床文档后结构化处理

无需人工干预,系统可直接进行后结构化处理,生成结构化OFD文档。


主观病历内容过于冗长? 

无妨,大型模型助您提炼核心,浓缩内容。


病历质控依赖人工审查? 

无碍,大型模型依据您设定的质控规则,自动为文档评分并提出修改建议。

 


在医疗信息化领域,电子病历数据的结构化与非结构化问题构成核心挑战。结构化数据易于处理分析,非结构化数据(如医生笔记、检查报告图片等需复杂技术处理。

人工智能技术,特别是文本识别与提取技术,能将非结构化数据转化为结构化信息,提升数据可用性和价值,优化临床决策支持系统,提高医疗服务质量和效率。

结语:

   

电子病历OFD版式文件后结构化处理中,结构化信息提取与整合极为重要。点聚的人工智能技术,特别是文本识别与提取技术,将非结构化医疗文档转换为结构化数据,便于存储、检索与分析。增强数据可用性,为临床决策支持系统提供数据支撑。结构化数据转化为知识,成为改善患者治疗和管理电子病历的强大助力。


点聚医疗OFD团队秉持“持续学习,合作共赢”理念,期待您的加入,共创智慧医疗新篇章。


下期推荐

下期内容将探讨OFD临床文档与国家商用密码应用结合,实现医疗文书可信化处理。敬请期待。

   



·