• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

Ruby中Yomu包从word,execl,pdf中读取文字

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

这几天一直在处理各种pdf文档,对于那些可以从pdf中复制出来的文字,我都是先手动把文字从pdf中复制出来,然后再用程序处理他的格式以及相关信息,但是一个程序员怎能采取如此笨的方法呢,今天无意间发现ruby有一个yomu的它可以从这些文档中华获取文字,格式很乱,还需要后期的处理,下面就来看看yomu如何从这些文档中获取文字。

  • 从给定的文件名中来读取文字(用的最多的方式)
requier "yomu"
yomu = Yomu.new \'sample.pages\'
text = yomu.text
  • 从url中获取文字(这个我还没有试过)
require "yomu"
yomu = Yomu.new \'http://svn.apache.org/repos/asf/poi/trunk/test-data/document/sample.docx\'
text = yomu.text

官方文档说的是必须要有一个可以运行的jre,里面有一些是java的包,需要jre才可以运行
以上这些都是我浅略的理解,后续还会更新,欢迎指正


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap