这篇文章主要介绍了Ruby使用REXML库来解析xml格式数据的方法,文章最后提及了REXML库的使用相关安全问题可以注意一下,需要的朋友可以参考下

REXML 是一个完全用ruby写的processor ,他有多种api,其中两个经典的api是通过DOM-like 和SAX-like 来进行区分的。第一种是将整个文件读进内存,然后存储为一个分层的形式(也就是一棵树了).而第二种是"parse as you go",当你的文件很大,并且内存受到限制的时候,比较适合用这种。
rexml具有如下特点:

  • 100%用ruby编写
  • 可以用来解析SAX和DOM
  • 轻量,不足2000行代码
  • 提供完整的API支持
  • ruby中内置

下面我们来看看如何使用它,假设我们有如下xml文件:

<collection shelf="New Arrivals">
 <movie title="Enemy Behind">
 <type>War, Thriller</type>
 <format>DVD</format>
 <year>2003</year>
 <rating>PG</rating>
 <stars>10</stars>
 <description>Talk about a US-Japan war</description>
 </movie>
 <movie title="Transformers">
 <type>Anime, Science Fiction</type>
 <format>DVD</format>
 <year>1989</year>
 <rating>R</rating>
 <stars>8</stars>
 <description>A schientific fiction</description>
 </movie>
 <movie title="Trigun">
 <type>Anime, Action</type>
 <format>DVD</format>
 <episodes>4</episodes>
 <rating>PG</rating>
 <stars>10</stars>
 <description>Vash the Stampede!</description>
 </movie>
 <movie title="Ishtar">
 <type>Comedy</type>
 <format>VHS</format>
 <rating>PG</rating>
 <stars>2</stars>
 <description>Viewable boredom</description>
 </movie>
</collection>

解析DOM:

require 'rexml/document'
include REXML
xmlfile = File.new("movies.xml")
xmldoc = Document.new(xmlfile)
root = xmldoc.root
puts "Root element : " + root.attributes["shelf"]
xmldoc.elements.each("collection/movie"){
 |e| puts "Movie Title : " + e.attributes["title"]
}
xmldoc.elements.each("collection/movie/type") {
 |e| puts "Movie Type : " + e.text
}
xmldoc.elements.each("collection/movie/description") {
 |e| puts "Movie Description : " + e.text
}

使用XPATH:

require 'rexml/document'
include REXML
xmlfile = File.new("movies.xml")
xmldoc = Document.new(xmlfile)
movie = XPath.first(xmldoc, "http://movie")
p movie
XPath.each(xmldoc, "http://type") { |e| puts e.text }
names = XPath.match(xmldoc, "http://format").map {|x| x.text }
p names

以备不时之需!

PS:关于REXML的安全问题
Ruby官方网站在8月23日发布了安全通告:http://www.ruby-lang.org/en/news/2008/08/23/dos-vulnerability-in-rexml/,在Ruby当前使用的XML解析库REXML在解析具有嵌套递归元素的XML文件的时候,将会出现拒绝服务攻击的缺陷,导致服务器资源耗尽!
凡是在Rails应用程序当中使用到了XML文件解析功能的都存在上述缺陷,需要进行修复。在Rails当中的修复办法如下:
1、Rails2.0.2和以前的老版本
下载修复文件,拷贝到RAILS_ROOT/lib目录下,并且在environment.rb当中加入语句

require ‘rexml-expansion-fix'

2、Rails 2.1.0以上版本
下载修复文件,拷贝到RAILS_ROOT/config/initializers目录下即可。

最新资讯
特斯拉:将自主研发新电池 预计4月正式宣布

特斯拉:将自主研发新电

特斯拉相关人士表示,特斯拉将自主研发新电池,预计会在4
苹果春季发布会或3月底举办:预计发布多款硬件新品

苹果春季发布会或3月

来自iPhone-ticker.de网站的消息称,苹果计划在今年3月3
微博将于2月26日发布2019年第四季度及全年财报

微博将于2月26日发布2

微博公司 定于美国东部时间2020年2月26日美国股市开盘
捐赠100万元后 得物App将1万件隔离衣等物资送往湖北

捐赠100万元后 得物Ap

得物App(原毒App)捐赠的第二批医疗物资近日发往武汉,包括
苹果美股盘前跌超4% 3月季度营收目标将无法实现

苹果美股盘前跌超4% 3

苹果美股盘前跌超4%。此前苹果对外宣布,受疫情影响,全球
棋(ma)牌(jiang)、换装类游戏春节增长最快,字节跳动成搅局者

棋(ma)牌(jiang)、换装类游戏春节

2020年春节期间下载量TOP10游戏中有3款来自字节跳动。
最新文章
Ruby编写HTML脚本替换小程序的实例分享

Ruby编写HTML脚本替换

这篇文章主要介绍了Ruby编写HTML脚本替换小程序的实例
解析proxy代理模式在Ruby设计模式开发中的运用

解析proxy代理模式在R

这篇文章主要介绍了proxy代理模式在Ruby设计模式开发
Ruby on Rails中Rack中间件的基础学习教程

Ruby on Rails中Rack

Rack是一个连接Ruby程序与服务器程序之间的中间件,甚
以MVC的思维方式来理解Ruby on Rails框架的设计结构

以MVC的思维方式来理

RubyonRails是Ruby世界中Web开发框架的代名词,人气相
Ruby基本的环境变量设置以及常用解释器命令介绍

Ruby基本的环境变量设

这篇文章主要介绍了Ruby基本的环境变量设置以及常用解
Ruby的基础语法入门学习教程

Ruby的基础语法入门学

这篇文章主要介绍了Ruby的基础语法入门学习教程,包括
炸金花 传奇私服 江西快3 炸金花