java – Apache Tika的C/C++替代品
发布时间:2020-05-24 11:52:37 所属栏目:Java 来源:互联网
导读:我正在寻找基于 Java的Apache Tika框架的C/C++替代方案.具体来说,我正在一个框架下搜索文件元数据和结构化文本提取.经过一些在线搜索和浏览,我最接近的是GNU libextractor和一堆单独的文件过滤器,解析文档以提取文本数据(pdftoext,xls2csv ..etc) 任何人都可
|
我正在寻找基于 Java的Apache Tika框架的C/C++替代方案.具体来说,我正在一个框架下搜索文件元数据和结构化文本提取.经过一些在线搜索和浏览,我最接近的是GNU libextractor和一堆单独的文件过滤器,解析文档以提取文本数据(pdftoext,xls2csv ..etc) 任何人都可以推荐一个与Apache的Tika相媲美的好库吗? 谢谢 解决方法Tika有一个网络服务器模式,所以你总是可以使用它启动Tika,然后从你的C代码发送请求?或者,Tika具有CLI模式,因此您可以每次启动新的Tika过程并从管道中读取数据. (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- java – 如何在Spring Boot项目中禁用Hibernate验证
- Spring4 MVC Hibernate4集成
- 如何将inputstream转换为InputStreamsource或Datasource以在
- java – 将过滤器添加到Eclipse中的Project Explorer
- java中 set,list,array互转
- java – 在编译的类中更改字符串常量
- java – Google Fit API,获取每项活动消耗的卡路里
- java-有没有使用存储库基类的方法来使用存储库吗?
- jdbc 使用PreparedStatement来存储和读取大数据(Blob或Clob
- C#和java中执行sql文件脚本的代码
