xml解析库对比总结(解析方式,第三方库,TinyXml)

xml解析库对比总结(解析方式,第三方库,TinyXml)

一. 解析方式

xml的2种解析方式(DOM和SAX解析方式): https://blog.csdn.net/weixin_42472048/article/details/81264570

dom解析和sax解析区别: dom方式解析 根据xml的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象 优点:很方便实现增删改操作 缺点:如果文件过大,造成内存溢出 sax方式解析 采用事件驱动,边读边解析,从上到下,一行一行的解析,解析到某一个对象,返回对象名称, 当SAX解析结束,不会保存任何XML文档的数据。 优点:如果文件过大,不会造成内存溢出,方便实现查询操作 缺点:不能实现增删改操作

二. 第三方库介绍对比:

尽管XML解析器有很多种,而且功能差异很大,甚至是支持跨平台、多语言,但是对于你的应用而言,尽量选择一种相对熟悉、功能够用的即可,没必要去追求庞杂的解析器,我们只需关注:功能够用、相对稳定、适合扩展这三个功能即可。一旦有问题,修正和扩展都要更为容易。

PugiXML:

仅DOM方式;速度快; https://www.cnblogs.com/haomiao/p/5041065.html

RapidXML:

仅DOM方式;速度快

libxml:

可以验证DTD;几乎适合于常见的所有操作系统下编译和开发使用; C代码支持XML解析最全的,支持xpath语法;

libxml++(地址:http://libxmlplusplus.sourceforge.net/)是对libxml XML解析器的C++封装版本。此外还有各种语言封装包,参加官方链接。

libxml的使用(1)--读取xml:https://www.cnblogs.com/fire909090/p/6798136.html

libxml2的安装及使用[总结]:https://www.cnblogs.com/Anker/p/3542058.html

Libxml2主要的优点有:

( http://blog.sina.com.cn/s/blog_a7c44c8801018qc5.html ):

1. 安装、使用比较简单,容易入门;

2. 支持的编码格式较多,能很好的解决中文问题(使用一个很简单的编码转换函数);

3. 支持Xpath解析(这点对于任意定位xml文档中的节点还是很有用的哦);

4. 支持Well-formed 和valid验证,具体而言支持DTD验证,Schema验证功能正在完善中(目前多数解析器都还不完全支持shema验证功能);

5. 支持目前通用的Dom、Sax方式解析等等。

不足之处也是有的:

1. 指针太多,使用不当时就会出现错误,在Linux系统中表现为常见的段错误,同样管理不当易造成内存泄漏;

2.个人认为内面有些函数的功能设计的不是很好(比如获取Xpath函数,它不获取节点属性,这样子有些情况会定位不准)

C/C++利用libxml2高效输出XML大文件详解:https://www.jb51.net/article/128707.htm

Xerces:

支持SAX和DOM ;可以验证DTD;文件越大,element解析越慢;除了C++版本,Xerces同时还提供Xerces Java,Xerces Perl等版本。

TinyXML:

DOM方式;C++开发,支持Windows和Linux。小巧玲珑,非常适合存储简单数据,配置文件,对象序列化等数据量不是很大的操作。支持对XML的读取和修改,不直接支持XPath,需要借助另一个相关的类库TinyXPath才可以支持XPath.

一个例子:https://blog.csdn.net/woniu211111/article/details/76445059

TinyXml库 使用方法: https://blog.csdn.net/qq_26374395/article/details/80171906

使用TinyXML读写xml文件: https://blog.csdn.net/lgstudyvc/article/details/77859919

TinyXml快速入门: https://blog.csdn.net/qq_38022972/article/details/82221898

TinyXml入门简易教程: https://blog.csdn.net/qq_24571549/article/details/70980125

-------------------------------------------------------------------------------------------------

配置使用过程:

1. tinyxml在windows环境下编译:https://blog.csdn.net/u012870721/article/details/78237930

2. Windows下Tinyxml的正确配置:https://blog.csdn.net/iorijjw/article/details/8515268

(在 "项目" -> "xxx 属性" -> "配置属性" -> "连接器" -> "输入" 中, 找到 "忽略特定默认库", 如果是 Debug 模式则向其中输入 libcmtd.lib 这步做与不做,有待进一步研究)

3. TinyXML Tutorial 中文指南:

http://www.cnblogs.com/kex1n/archive/2010/10/03/1841502.html

在线文档: http://www.grinninglizard.com/tinyxmldocs/tutorial0.html

------------------------------------------------------------------

遇到的问题:

tinyxml中文乱码(内存模式): https://blog.csdn.net/myruo/article/details/81514118

-------------------------------------------------------------------------------------------------

一个简单的实例应用:写xml文件

#include "tinyXml.h"

#pragma comment(lib, "tinyxml.lib")

#pragma comment(lib, "tinyxmlSTL.lib")

int main()

{

build_simple_doc();

system("pause");

return 0;

}

void build_simple_doc()

{

/*

*/

TiXmlDocument doc;

TiXmlDeclaration *decl = new TiXmlDeclaration("1.0", "utf-8", "");

doc.LinkEndChild(decl);

TiXmlElement *rootElement = new TiXmlElement("scene");

rootElement->SetAttribute("version", "0.5.0");

//TiXmlText *text = new TiXmlText("world");

//rootElement->LinkEndChild(text);

doc.LinkEndChild(rootElement);

TiXmlElement *myIntegrator = new TiXmlElement("integrator");

myIntegrator->SetAttribute("type", "path");

rootElement->LinkEndChild(myIntegrator);

TiXmlElement *myBoolean = new TiXmlElement("boolean");

myBoolean->SetAttribute("name", "hideEmitters");

myBoolean->SetAttribute("value", "false");

myBoolean->SetAttribute("otherAttriube", "someValue");

myIntegrator->LinkEndChild(myBoolean);

/*

注意:myBoolean没有EndChild, 所以不会有 这一行

同一个element不能添加两次(树结构),会导致卡死!!

*/

TiXmlComment *comment = new TiXmlComment();

comment->SetValue("物体模型");

rootElement->LinkEndChild(comment);

doc.SaveFile("example1_byhand.xml");

}

一个简单的实例应用:修改xml文件:

代码:

void modify_secene_xml(const char* pFilename)

{

printf("File: %-s:\n", pFilename);

TiXmlDocument doc(pFilename);

if (!doc.LoadFile()) return;

TiXmlHandle hDoc(&doc);

TiXmlElement* pElem;

TiXmlHandle hRoot(0);

TiXmlHandle subRoot(0);

pElem = hDoc.FirstChildElement().Element();

if (!pElem) return;

hRoot = TiXmlHandle(pElem);

//pElem = hRoot.FirstChild("shape").FirstChildElement().Element();

//pElem = pElem->NextSiblingElement()->NextSiblingElement();

modify string in texture

pElem = hRoot.FirstChild("shape").FirstChild("bsdf").Element();

subRoot = TiXmlHandle(pElem);

pElem = subRoot.FirstChild("bsdf").FirstChild("texture").FirstChildElement().Element();

printf( "%-20s\t-->\t", pElem->Attribute("value") );

pElem->SetAttribute("value", "mydefine.png"); // <--------------------

printf("%-20s\n", pElem->Attribute("value"));

modify value of string of emitter

pElem = hRoot.FirstChild("emitter").FirstChild("string").Element();

printf("%-20s\t-->\t", pElem->Attribute("value"));

pElem->SetAttribute("value", "mydefineenvmap.exr"); // <--------------------

printf("%-20s\n", pElem->Attribute("value"));

doc.SaveFile(pFilename);

}

//************************************************************//

int main()

{

modify_secene_xml("test_byhand.xml"); // <--------------------

system("pause");

return 0;

}

待修改文件:(修改 "original.png" 及 "original.exr" )

打印结果:

三. 链接

C++各大有名库的介绍对比:https://blog.csdn.net/business122/article/details/78260909

常见C/C++ XML解析器比较:https://www.cnblogs.com/snailgardening/p/xml_jiexi.html

相关推荐

率土之滨名望怎么获取 名望有什么用
365用什么浏览器登录

率土之滨名望怎么获取 名望有什么用

📅 06-29 👁️ 7398
为什么蚊子老咬你?答案可能跟你想的不一样……
365网站不给出款怎么办

为什么蚊子老咬你?答案可能跟你想的不一样……

📅 06-30 👁️ 1936
Vivo 备份与恢复:数据安全的完整指南
microsoft365版本

Vivo 备份与恢复:数据安全的完整指南

📅 06-29 👁️ 5745