怎樣解決xml編碼問(wèn)題在VB,PHP,JAVA下的問(wèn)題_Xml教程
推薦:xml數(shù)據(jù)存入數(shù)據(jù)庫(kù)的解決辦法當(dāng)我們要把xml格式的數(shù)據(jù)存到數(shù)據(jù)庫(kù)中。通常的辦法是解析xml文件,讀出xml中的數(shù)據(jù)類(lèi)型并根據(jù)它創(chuàng)建數(shù)據(jù)庫(kù)表和表之間的結(jié)構(gòu),讀出xml中的數(shù)據(jù),存入到數(shù)據(jù)庫(kù)之中。 在讀nodeType是要注意二個(gè)問(wèn)題: 1.讀某個(gè)節(jié)點(diǎn)數(shù)據(jù)類(lèi)型可以對(duì)上一個(gè)節(jié)點(diǎn)的孩子,或直接使本節(jié)
解決xml編碼問(wèn)題在VB,PHP,JAVA下的問(wèn)題最近碰到一個(gè)項(xiàng)目,需要將申報(bào)文件存成XML的格式,編碼問(wèn)題著實(shí)讓我頭疼了一會(huì)。現(xiàn)在全部統(tǒng)一成UTF-8編碼。具體在各種語(yǔ)言下的操作。這里,我用DOM進(jìn)行XML解析,應(yīng)為它簡(jiǎn)單。
1 客戶(hù)首先使用VB進(jìn)行編輯表單,生成一個(gè)apply.xml文件。
在VB中,使用MSXML 4.0。如果不設(shè)定編碼方式,保存的時(shí)候,文件默認(rèn)就是UTF-8編碼
Set dom = CreateDOM
Set node = dom.createProcessingInstruction("xml", "version='1.0'")
dom.appendChild node
Set node = Nothing
2 客戶(hù)將這個(gè)XML通過(guò)Web上傳到服務(wù)器
在PHP中,XMLDOM只支持UTF-8作為默認(rèn)編碼。所以生成的XML文件,上傳以后可以直接解析這個(gè)文件,獲得一些信息
if (!dom = domxml_open_mem(content)) {
t->assign('msg', "文件解析錯(cuò)誤!");
t->render('noavailable.html', PAGE_TITLE, 'wrap.html');
exit;
}
接下來(lái),要將這個(gè)文件存到數(shù)據(jù)庫(kù)里面,因?yàn)閿?shù)據(jù)庫(kù)使用MS Sql Server,它不支持UTF-8的數(shù)據(jù)結(jié)構(gòu),所以將整個(gè)文件以二進(jìn)制的方式存到數(shù)據(jù)庫(kù)里面,這里讓我搞了半天的就是二進(jìn)制文件的存放方式,如果是mysql,那不需要做任何轉(zhuǎn)換就可以直接存了,但是mssql不行,原因是:
This is because the MSSQL parser makes a clear distinction between binary an character constants. You can therefore not easilly insert binary data with "column = 'data'" syntax like in MySQL and others.
The MSSQL documentation states that binary constants should be represented by their unquoted hexadecimal byte-string. That is.. to set the binary column "col" to contain the bytes 0x12, 0x65 and 0x35 you shold do "col = 0x126535" in you query.
具體操作如下:
//讀取上傳的文件
original = _FILES['content']['name'];
if (!empty(original)) {
if (_FILES['content']['type'] == "text/xml") {
filename = _FILES['content']['tmp_name'];
handle = fopen(filename, "rb");
originalcontent = fread(handle, filesize(filename));
fclose(handle);
}
} //end if(!empty(original))
originalcontent = unpack("H*hex", originalcontent); //這步是關(guān)鍵
db->query("insert into ".TBL_SB_ONLINE_USER." (sb_id, user_id, username, sbmc, content, created_date) values ("
.newid.", "
.u.", "
.db->quote(stripslashes(name)).", "
.db->quote(stripslashes(sbmc)).", 0x"
.originalcontent['hex'].", " //注意這里,前面有0x
."'now')");
3 上傳之后,用戶(hù)也可以在網(wǎng)上對(duì)這個(gè)文件進(jìn)行在線編輯,這時(shí)需要將這個(gè)文件從數(shù)據(jù)庫(kù)讀出,然后還原成UTF-8編碼,再進(jìn)行解析。雖然我們上面使用了unpack,但讀出的時(shí)候不需要還原。
sb = db->getRow('select sbmc, content from '.TBL_SB_ONLINE_USER." where sb_id = sb_id");
originalcontent =sb[content];
if (!dom = domxml_open_mem(originalcontent)) {
t->assign('msg', "文件解析錯(cuò)誤!");
t->render('noavailable.html', PAGE_TITLE, 'wrap.html',true);
exit;
}
context = xpath_new_context(dom);
xpath = context->xpath_eval("//material/xm");
t->assign('xm',iconv("UTF-8","GBK",xpath->nodeset[0]->get_content()));
讀出的時(shí)候,mssql除了用于 SQL Server 的 Microsoft OLE DB 提供程序和 SQL Server ODBC 驅(qū)動(dòng)程序自動(dòng)將 @@TEXTSIZE 設(shè)置為最大值 2 GB。其他的都是4096 (4 KB),所以用PHP訪問(wèn)時(shí)候,務(wù)必將下面打開(kāi)mssql.textlimit = 2147483647
mssql.textsize = 2147483647
4 后臺(tái)用VB,要解析該函數(shù)需要添加以下代碼,用來(lái)將byte()轉(zhuǎn)換成utf-8編碼
Public Declare Function MultiByteToWideChar Lib "kernel32" (ByVal CodePage As Long, ByVal dwFlags As Long, ByVal lpMultiByteStr As Long, _
ByVal cchMultiByte As Long, ByVal lpWideCharStr As Long, ByVal cchWideChar As Long) As Long
Public Const CP_UTF8 = 65001
Public Function UTF8_Decode(bUTF8() As Byte) As String
Dim lRet As Long
Dim lLen As Long
Dim lBufferSize As Long
Dim sBuffer As String
Dim bBuffer() As Byte
lLen = UBound(bUTF8) + 1
If lLen = 0 Then Exit Function
lBufferSize = lLen * 2
sBuffer = String(lBufferSize, Chr(0))
lRet = MultiByteToWideChar(CP_UTF8, 0, VarPtr(bUTF8(0)), lLen, StrPtr(sBuffer), lBufferSize)
If lRet <> 0 Then
sBuffer = Left(sBuffer, lRet)
End If
UTF8_Decode = sBuffer
End Function
具體讀數(shù)據(jù)庫(kù)的操作是
Dim varcontent() As Byte
varfilesize = mrc.Fields("content").ActualSize
varcontent = mrc.Fields("content").GetChunk(varfilesize)
content = UTF8_Decode(varcontent)
xmlDoc.async = False
xmlDoc.resolveExternals = False
xmlDoc.loadXML (content)
If (xmlDoc.parseError.errorCode <> 0) Then
Dim myErr
Set myErr = xmlDoc.parseError
MsgBox ("發(fā)生錯(cuò)誤 " & myErr.reason)
Else
xmlDoc.setProperty "SelectionLanguage", "XPath"
5 后臺(tái),在Java里面就更好操作了,將讀出的數(shù)據(jù)變成byte[],然后轉(zhuǎn)換成UTF-8的字符串。
最后要說(shuō)的是,PHP的確是一個(gè)非常強(qiáng)大的腳本語(yǔ)言,如果開(kāi)發(fā)PHP過(guò)程中遇到難以解決,google都不容易搜到的問(wèn)題,大家直接上php.net的在線文檔,文檔里面通常有很多好心人將自己的使用心得寫(xiě)在上面,非常有幫助。
這樣就能解決xml編碼問(wèn)題在VB,PHP,JAVA下的問(wèn)題。
分享:XMLHttpRequest在Web開(kāi)發(fā)利弊一、引言 在XMLHttpRequest對(duì)象和AJAX給用戶(hù)和開(kāi)發(fā)者帶給巨大好處的同時(shí),也許還有一些問(wèn)題你沒(méi)有考慮到-但是的確到了值得引起每個(gè)人注意的時(shí)候了。甚至非常討厭的人也都喜歡XMLHttpRequest,因?yàn)樗峁┙o程序員真正夢(mèng)想的功能。也正是因?yàn)橛辛诉@樣的新技術(shù),
- xml創(chuàng)建節(jié)點(diǎn)(根節(jié)點(diǎn)、子節(jié)點(diǎn))
- WML開(kāi)發(fā)教程之 WAP網(wǎng)站服務(wù)器配置方法
- WMLScript的語(yǔ)法基礎(chǔ)
- 收集的WML Script標(biāo)準(zhǔn)函數(shù)庫(kù)
- WML教程之文本框控件Input
- 無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)
- xml文件的結(jié)構(gòu)解讀
- 關(guān)于XSL - XSL教程
- 選擇模式 - XSL教程 - 2
- XPath入門(mén) - XSL教程 - 3
- 匹配模式 - XSL教程 - 4
- 測(cè)試模式 - XSL教程 - 5
- 相關(guān)鏈接:
- 教程說(shuō)明:
Xml教程-怎樣解決xml編碼問(wèn)題在VB,PHP,JAVA下的問(wèn)題
。