linuxsir首页 LinuxSir.Org | Linux、BSD、Solaris、Unix | 开源传万世,因有我参与欢迎您!
网站首页 | 设为首页 | 加入收藏
您所在的位置:主页 > 小企鹅新闻图书馆 >

Apache Any23 发布 2.0 版本,Web 服务&命令行工具

时间:2017-02-28  来源:未知  作者:linuxsir首页

Apache  Anything To Triples(any23)是一个库、Web 服务和命令行工具,它从各种 Web 文档中提取 RDF 格式的结构化数据。 目前支持以下格式:

  • RDF/XML、Turtle、Notation 3

  • RDFa

  • Microformats1、Microformats2

  • JSON-LD

  • HTML5 Microdata

  • CSV

  • Vocabularies

  • YAML

部分更新内容:

Sub-task

  • 大修 README.txt

Task

  • 更新 OpenRDF Sesame 至 2.7.0 版本

  • 解决与 1.1#1 RC 的问题

Improvement

  • 将命令行工具拆分为单独的模块

  • 向 HTMLMetaExtractor 添加缺少的 <meta> 元素属性

  • 实施 Microformats2

  • 将 Open Graph Protocol 和 Facebook 前缀添加到 Popular.prefix

  • 更新至 Tika 1.7

  • 在数据提取文档源示例中的小错字

  • Any23 不在 JDK1.8 下构建

更多改进和 bug 修复,请查看完整更新日志。

下载地址:

http://any23.apache.org/download.html

友情链接