FAIR数据在地球科学中的重要性

Jans Aasman,博士13 九月 2019

随着时间的推移,数据作为企业资产的估值最为明显。如果管理得当,同一数据集支持多个用例,几乎可以根据请求立即获得,并且可以在部门或组织之间进行交换,以便系统地提高每次部署的产量。

利用数据作为企业资产的这些恩惠是GO FAIR的可查找可访问互操作可重用(FAIR)原则的基础,这些原则深刻地影响着地质科学的数据管理严格性。这个领域的许多组织已经接受了这些原则,以便迅速地在各种学科之间共享信息,以安全地指导地球的管理。

根据地球科学信息合作伙伴(ESIP)实验室主任Annie Burgess博士的说法,“一个组织无法解决”最紧迫的全球挑战。科学家需要跨多个学科收集的数据,这些学科通常由许多不同的机构和机构管理。“正如地球科学界众多成员所认识到的那样,根据FAIR原则管理这些不同数据的最有效方法是利用语义标准。支撑知识图。

管理元数据,数据模型和术语的这些统一方法是FAIR数据运动的关键,确保数据成为科学界珍贵的资产。

公共科学
支持知识图的语义标准被设计用于以机器可读格式唯一地识别,立即访问和共享数据。它们与在万维网上促进这些优势的标准相同,并且对于在地质科学领域重用数据非常有益。该领域是更具挑战性的科学领域之一,因为它是如此广泛,包括海洋生物,大气关注,土地群和地下开发。快速共享这些不同专业化数据的能力是推动整个领域不可或缺的一个方面,以及通过机器可读技术唯一识别数据和快速访问数据的其他优势。

观察到加利福尼亚理工学院喷气推进实验室的数据科学家Lewis McGibbney博士和NASA ESDSWG搜索相关工作组的联合主席,“我们正处在一个激动人心的阶段,那里有大量专家和组织。具有类似目标的全球以及我们需要知识密集型应用程序的认识。语义技术堆栈是为地理科学领域内的知识密集型用例构建智能应用程序的关键部分。“此外,语义标准使这些组织能够以可重用的格式发布数据和结果,以便不同的组织直接从彼此的劳动中受益。

连接人类和机器
FAIR方法围绕知识图中的不同数据链接。反过来,这些知识图可以在不同的组织之间链接,也可以在Web上“发布”以实现通用访问 - 这对于互操作性至关重要。这种方法不仅要求每个单独的数据都有自己唯一的标识符,而且还要根据标准化的词汇表和分类法对其元数据进行丰富的描述,这些标准化的词汇表和分类法可以通过机器快速理解和访问。语义数据模型(本体)标准化不同组织针对不同应用程序使用的模式的固有差异,进一步帮助IT系统采用FAIR原则的互操作性。

蒙特利湾水族馆研究所高级软件工程师Carlos Rueda评论说,“海洋元数据互操作性项目开发了MMI本体注册和存储库(ORR),它利用AllegroGraph提供强大的可互操作语义服务,使网络上的内容以一种有意义的方式相互连接通过使海洋元数据互操作性项目中的不同科学组织能够以这种标准化方式注册其无数存储库的本体,加快了数据集成和可访问性。

统一多样性

也许利用地球科学界知识图启动FAIR原则的资本优势是能够对与科学家相关的各类潜水员数据进行标准化。该领域中不同专业的绝对数量需要看似无限多样的数据。来源包括来自水,天线和地面源的传感器数据,以及卫星数据和物理样本的数据。此外,这些数据的特征在于许多不同的空间和时间分辨率,增加了均匀管理它们的总体复杂性。在这方面,语义数据模型大大有助于统一词汇描述数据。 Burgess博士提到了“ESIP社区本体存储库的优点,这是一个管理和交换术语和词汇表的社区平台,可以帮助科学家发布,发现和重用数据。”

长期传播
随着地质科学界的大量使用案例的揭示,数据的真正推崇是基于其持久的可重用性和即时可访问性。这些优先事项催生了FAIR运动,这取决于语义技术的实施。当应用于当代组织时,这种方法可以带来同样的好处:数据作为企业资产的价值增加。

关于作者
Jans Aasman是博士。心理学家,认知科学专家,Franz Inc.首席执行官,人工智能的早期创新者和领先的语义图数据库AllegroGraph的提供者。作为科学家和首席执行官,Aasman博士继续在人工智能和知识图谱领域取得突破,因为他与众多财富500强企业以及美国和外国政府携手合作。 Aasman博士的职业生涯大部分时间都专注于应用人工智能项目,智能用户界面和电信研究。他在语音技术,多模式用户交互,推荐引擎等领域积累了专利,同时开发了平板电脑和个人助理的前体技术。他是代尔夫特理工大学工业设计系的教授,也是智能数据,NoSQL Now,国际语义网络会议,GeoWeb,AAAI,企业数据世界,全球图形峰会,文本分析等活动的着名会议发言人。和TTI Vanguard。