六月婷婷综合激情-六月婷婷综合-六月婷婷在线观看-六月婷婷在线-亚洲黄色在线网站-亚洲黄色在线观看网站

明輝手游網中心：是一個免費提供流行視頻軟件教程、在線學習分享的學習平臺！

文章發布全站軟件文章熱門搜索：喜歡朋友 K歌手機酷狗電臺搜索資訊首頁騰訊視頻愛奇藝暴風影音酷狗音樂酷我音樂影音大全軟件下載軟件教程電腦系統下載聊天工具辦公軟件殺毒教程系統工具圖形圖像電腦學習應用軟件網絡軟件蘋果應用注冊碼網站教程技術開發安卓教程其它教程您當前所在位置：網視手游站 -> 技術開發 -> 中文顯示原理研究
中文顯示原理研究發表時間：2023-08-13 來源：明輝站整理相關軟件相關文章人氣： [摘要]預備知識：　1.字節和unicode 　　Java內核是unicode的，就連class文件也是，但是很多媒體，包括文件/流的保存方式　　是使用字節流的。因此Java要對這些字節流經行轉化。c... 預備知識：　1.字節和unicode 　　Java內核是unicode的，就連class文件也是，但是很多媒體，包括文件/流的保存方式　　是使用字節流的。因此Java要對這些字節流經行轉化。char是unicode的，而byte是字節. 　　Java中byte/char互轉的函數在sun.io的包中間有。其中ByteToCharConverter類是中調度，　　可以用來告訴你，你用的Convertor。其中兩個很常用的靜態函數是　　 public static ByteToCharConverter getDefault() ; 　　 public static ByteToCharConverter getConverter(String encoding); 　　如果你不指定converter，則系統會自動使用當前的Encoding,GB平臺上用GBK,EN平臺上用　　8859_1 　　　　我們來就一個簡單的例子：　　　　　"你"的gb碼是：0xC4E3 ,unicode是0x4F60 　　　　　你用: 　　　　　--encoding="gb2312"; 　　　　　--byte b[]={(byte)'\u00c4',(byte)'\u00E3'}; 　　　　　--convertor=ByteToCharConverter.getConverter(encoding); 　　　　　--char [] c=converter.convertAll(b); 　　　　　--for(int i=0;i<c.length;c++) 　　　　　--{ 　　　　　-- System.out.println(Integer.toHexString(c[ i])); 　　　　　--} 　　　　　--打印出來是0x4F60 　　　　　--但是如果使用8859_1的編碼，打印出來是　　　　　--0x00C4,0x00E3 　　　　　----例１　　　　反過來：　　　　 --encoding="gb2312"; 　　　　　　　char c[]={'\u4F60'}; 　　　　　　　 convertor=ByteToCharConverter.getConverter(encoding); 　　　　　--byte [] b=converter.convertAll(c); 　　　　　--for(int i=0;i<b.length;c++) 　　　　　--{ 　　　　　-- System.out.println(Integer.toHexString(b[i])); 　　　　　--} 　　　　　　--打印出來是：0xC4,0xE3 　　　　　　----例２　　　　　　--如果用8859_1就是0x3F，?號，表示無法轉化　　　　　　-- 　　　　　很多中文問題就是從這兩個最簡單的類派生出來的。而卻有很多類　　　　不直接支持把Encoding輸入，這給我們帶來諸多不便。很多程序難得用encoding 　　了，直接用default的encoding，這就給我們移植帶來了很多困難　　-- 　　2.UTF-8 　　--UTF-8是和Unicode一一對應的，其實現很簡單　　-- 　　 -- 7位的Unicode: 0 _ _ _ _ _ _ _ 　　--11位的Unicode: 1 1 0 _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--16位的Unicode: 1 1 1 0 _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--21位的Unicode: 1 1 1 1 0 _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 　　--大多數情況是只使用到16位以下的Unicode: 　　--"你"的gb碼是：0xC4E3 ,unicode是0x4F60 　　--我們還是用上面的例子　　--　　--例１：0xC4E3的二進制：　　--　　--　　　 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 1 　　--　　--　　　由于只有兩位我們按照兩位的編碼來排，但是我們發現這行不通，　　--　　--　　　因為第７位不是0因此，返回"?" 　　--　　--　　　　　--　　--例２：0x4F60的二進制：　　--　　--　　　 0 1 0 0 1 1 1 1 0 1 1 0 0 0 0 0 　　--　　--　　　我們用UTF-8補齊，變成：　　--　　--　　　 11100100 10111101 10100000 　　--　　--　　　 E4--BD-- A0 　　--　　--　　　于是返回0xE4,0xBD,0xA0 　　--　　-- 　　3.String和byte[] 　　--String其實核心是char[],然而要把byte轉化成String，必須經過編碼。　　--String.length()其實就是char數組的長度，如果使用不同的編碼，很可　　--能會錯分，造成散字和亂碼。　　--例：　　----byte [] b={(byte)'\u00c4',(byte)'\u00e3'}; 　　----String str=new String(b,encoding);　　---- 　　----如果encoding=8859_1，會有兩個字，但是encoding=gb2312只有一個字　　---- 　　--這個問題在處理分頁是經常發生　　4.Reader,Writer/InputStream,OutputStream 　　--Reader和Writer核心是char，InputStream和OutputStream核心是byte。　　--但是Reader和Writer的主要目的是要把Char讀/寫InputStream/OutputStream --一個reader的例子： --文件test.txt只有一個"你"字，0xC4,0xE3-- --String encoding=; --InputStreamReader reader=new InputStreamReader( ----new FileInputStream("text.txt"),encoding); --char []c=new char[10]; --int length=reader.read(c); --for(int i=0;i<c.length;i++) ----System.out.println(c[i]); 　　--如果encoding是gb2312，則只有一個字符，如果encoding=8859_1，則有兩個字符　　-------- -- -- 　　　　 ---- 　2.我們要對Java的編譯器有所了解：　--javac -encoding 　我們常常沒有用到ENCODING這個參數。其實Encoding這個參數對于跨平臺的操作是很重要的。　如果沒有指定Encoding，則按照系統的默認Encoding,gb平臺上是gb2312，英文平臺上是ISO8859_1�！� 　--Java的編譯器實際上是調用sun.tools.javac.Main的類，對文件進行編譯，這個類　-- 　有compile函數中間有一個encoding的變量,-encoding的參數其實直接傳給encoding變量。　編譯器就是根據這個變量來讀取java文件的，然后把用UTF-8形式編譯成class文件。　一個例子：　--public void test() 　--{ 　----String str="你"; 　----FileWriter write=new FileWriter("test.txt"); 　----write.write(str); 　----write.close(); 　--} 　----例３ --如果用gb2312編譯，你會找到E4 BD A0的字段 -- --如果用8859_1編譯， --00C4 00E3的二進制： --00000000 11000100 00000000 11100011-- --因為每個字符都大于7位，因此用11位編碼： --11000001 10000100 11000011 10100011 --C1-- 84--　C3--　 A3 --你會找到C1 84 C3 A3 -- 　　　　　　但是我們往往忽略掉這個參數，因此這樣往往會有跨平臺的問題：　　--　　例３在中文平臺上編譯，生成ZhClass 　　--　　例３在英文平臺上編譯，輸出EnClass 　　--1.　 ZhClass在中文平臺上執行OK,但是在英文平臺上不行　　--2.　 EnClass在英文平臺上執行OK,但是在中文平臺上不行　　原因：　--1.在中文平臺上編譯后，其實str在運行態的char[]是0x4F60,　---- 　--在中文平臺上運行，FileWriter的缺省編碼是gb2312,因此　--CharToByteConverter會自動用調用gb2312的converter,把str轉化　--成byte輸入到FileOutputStream中，于是0xC4,0xE3放進了文件。　--但是如果是在英文平臺下，CharToByteConverter的缺省值是8859_1, 　--FileWriter會自動調用8859_1去轉化str,但是他無法解釋，因此他會　--輸出"?"　---- 　--2.　在英文平臺上編譯后，其實str在運行態的char[]是0x00C4 0x00E3,　---- 　--在中文平臺上運行，中文無法識別，因此會出現?? 　--　　在英文平臺上，0x00C4-->0xC4,0x00E3->0xE3，因此0xC4,0xE3被放進了　--文件 ---- 1.對于JSP正文的解釋： --Tomcat首先看一下你的葉面中有沒有"<%@page include的符號。有，則在相同 --地方設定response.setContentType(..);按照encoding的來讀，沒有他按照8859_1 --讀取文件，然后用UTF-8寫成.java文件，然后用sun.tools.Main去讀取這個文件， --（當然它使用UTF-8去讀），然后編譯成class文件 --setContentType改變的是out的屬性，out變量缺省的encoding是8859_1 2.對Parameter的解釋 --很不幸Parameter只有ISO8859_1的解釋，這個質料可以在servlet的實現代碼中找到。 3.對include的解釋格式的，但是很不幸，由于那個寫"org.apache.jasper.compiler.Parser"的人在數組JspUtil.ValidAttribute[]忘記加了一個參數：encoding,因此導致不支持這種方式。你完全可以編譯源代碼，加上對encoding的支持總結：如果你在NT底下，最簡單的方法就是欺騙java,不加任何Encoding變量： <html> 你好<%=request.getParameter("value")%> </html> http://localhost/test/test.jsp?value=你結果:你好你但這種方法局限性較大，比如對上傳的文章分段，這樣的做法是死定的，最好的解決方案是用這種方案： <%@ page contentType="text/html;charset=gb2312" %> <html> 你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%> </html> 必讀好文,但解決方案不敢恭維 -------------------------------------------------------------------------------- 1.網頁傳參數不提倡用get方法,而且用戶可以調整是否用utf-8發送 2.建議jsp中最好不要用,實際上加不加這句都有實現中文正常顯示的方案,我認為不加方便些,至少不用寫這些代碼,如下的配置我認為可以使中文正常顯示: a.所有的javabean用iso8859-1編譯 b.jsp文件中不要寫以上charset=gb2312的語句(寫了反而錯) 在tomcat情況下注意以上2點就行---了,等等,對于其他有可能不行的jsp服務器,加上以下 c.服務器上的操作系統語言設為英文(像沒有裝類似bluepoint中文系統的linux一般本來就是英文) 就行---了誰要是還不對,請報告.... Re：必讀好文,但解決方案不敢恭維 -------------------------------------------------------------------------------- Tomcat的參數問題無論是GET或是POST方式都是用8859_1編碼的。這個可以看Tomcat Servlet實現的源代碼: a) 對于POST方法　javax.servlet.http.HttpUtils的parsePostData方法： (對于POST的Form數據) 　String postedBody = new String(postedBytes, 0, len, "8859_1");)這里是沒有問題的因為中文都會用%來說明。但是parseName這個函數，卻沒有把是中文的東西整合起來，他只是簡單的拼湊，因此可以認定他是使用8859_1的編碼規則　 sb.append((char) Integer.parseInt(s.substring(i+1, i+3), 16)); ----　　i += 2; -- b) 對于GET方法　org.apache.tomcat.service.http.HttpRequestAdapter 　　　--　line=new String(buf, 0, count, 　　　　　　 Constants.CharacterEncoding.Default); ----Constants.CharacterEncoding.Default=8859_1 　這段代碼不好跟蹤，千萬不要被一些假象迷惑住。HttpRequestAdapter是從RequestImpl中派生的。但是，實際上用8080端口的Server并沒有直接用到RequestImpl，而是用了HttpRequestAdapter來獲得queryString 對于加不加encoding，我保留我的意見，因為如果要解決上傳文件分頁問題，必須要用他來編碼。而且編碼能保證在一些Beans當中的傳遞性。看來我要在這里說明一下了 -------------------------------------------------------------------------------- Tomcat僅僅是一個對jsp1.1,servlet2.2的一個標準的實現,我們不應該要求這個免費軟件在細致末節上和性能上都面面俱到,它主要考慮的英文用戶,這也是為什么不作特殊轉換我們的漢字用url方法傳遞有問題的原因,我們大部分瀏覽器ie其高級設置中始終以utf-8發送url的選項缺省是選上的,如果說這是tomcat的bug也是可以的,另外Tomcat不管當前的操作系統是什么語言,好像都按iso8859去編譯jsp,我覺得也有點欠妥,但是不管怎么說,新標準的實現和熱門的軟件在語言的支持方面永遠都是先考慮英文我的方案什么說要好一些呢 1.還是那句話,英文國家的軟件永遠都是先考慮英文,java虛擬機的規范中要求虛擬機內部必須實現iso8859,unicode,UTF-8三種,其他的不作要求,我們用的jdk中的虛擬機就是這樣,嵌入式的就更不用說了,也就是說其他的ENCODE都很可能不是java虛擬機內部直接支持的,我們的中文自然也不在其列,需要外部的包支持轉換,sun jdk應該在i18n.jar中,用iso8859速度最快,不需要其它調用和交換什么的,更沒有讀包的io操作 2.至少少寫了代碼,沒有額外操作,簡潔的風格誰不喜歡 3.所寫的jsp頁面國際性化好,我才寫了一個jsp+javabeans的聊天室軟件(沒有用到servlet,jsp真的確實很好),同樣的程序美國人用他們的瀏覽器進入就是英文界面,中文進入就是中文界面,如果加上charset=gb2312至少很麻煩 4.限定了gb2312,如果用戶要用GBK,怎么辦,不加更好,不管什么的字符集,只要我當前瀏覽器設定的是,我就能顯示出來總結:無論從速度上,開發效率上,和可擴展性上考慮,我的方案都比你的好,另外,我找不到你的方案比我的好的地方. 標簽：中文顯示原理研究上一篇：在HTML頁面中完成點擊數統計下一篇：Zend Optimizer 設置向導	推薦資訊總人氣榜 1PS提示：因為圖層已鎖定，無法編輯圖層的處理方法 2picacg蘋果版怎么找不到\|picacg ios版是不是下架了介紹 3Adobe Illustrator CS5 序列號大全 4ACDsee注冊碼免費分享（含ACDsee18、ACDsee10等版本） 5Potato(土豆聊天)怎么換頭像\|Potato app更改頭像方法介紹 6PDF瀏覽器能看3D文件嗎？PDF瀏覽器看3D文件圖文詳細教程 7Potato(馬鈴薯聊天)怎么注冊不了\|Potato不能注冊處理方法介紹 8最新的Adobe Illustrator CS4序列號大全 9Intel i7-9700K性能跑分曝光：同代提升約12% 10qq郵件是否已讀怎么看 QQ郵箱已經發出去的郵件怎么知道對方是否已經查看 11XP系統怎么清除緩存？ 12Intel Z390主板有望10月8日公布：8核9代酷睿隨后登場 1PHP 留言簿（帶Oracle數據庫分頁的顯示技巧） 2php.ini 設置詳細選項 3轉：Java技術版主Jeru在IBM的DevelopWorks發表的對于設模的文章 4Visual C++剪貼板設置不完全攻略 5基于ACCESS數據庫的純asp論壇制作心得 610天學會php之首天 7PHP新手上路--6. 網絡資源 8Csharp+Asp.net系列圖文詳細教程（二） 9用PHP開發GUI（一個容易的例子） 10一個技巧完善的專欄管理的程序->這是asp.net的第二個應用(4) 113天學好ADO之首天 12讓動態創建的ActiveX控件響應Windows消息最新教程本月人氣 1在ASP中使用智島網格控件全過程 2發送mime郵件類--案例 3使用WHOIS協議查詢Internet域名 4AutoThrCode 3層結構業務層代碼自動生成工具 5XML完成異構數據庫間轉換的完成與區分（轉） 6VB中調用Windows API函數檢測當前系統環境 7客戶端Cookie中文編程 8使用Winsock控件完成局域網通信 9在 WebService 中使用屬性 10用ASP編寫計數器的優化方法 11基于 Weblogic 7.0 的應用開發 12以動態模塊的方式安裝apache2.0.44+PHP4.3.0 1獵豹瀏覽器搶票不受12306新版驗證碼影響 2ios9不越獄怎么恢復短信與照片 ios9不越獄恢復短信與照片圖文說明教程 310天學會php之首天 4抱抱app怎么玩抱抱app使用圖文說明教程圖 5360手機助手紅包怎么提現 360手機助手紅包提現設置流程 6160wifi遠程桌面怎么連接 160wifi遠程桌面連接設置方法 7微信PC版1.0.7.33官方下載公布修好bug優化軟件 8手機登12306驗證碼總是出錯處理方法介紹 9Linux內核4.2優化了哪一些地方？ 10linux系統使用命令維護RHCS的方法 113天學好ADO之首天 12抱抱app免費隨機通話使用圖文說明教程(圖文流程)
相關文章在ASP中使用智島網格控件全過程發送mime郵件類--案例使用WHOIS協議查詢Internet域名 AutoThrCode 3層結構業務層代碼自動生成工具 XML完成異構數據庫間轉換的完成與區分（轉） VB中調用Windows API函數檢測當前系統環境客戶端Cookie中文編程使用Winsock控件完成局域網通信在 WebService 中使用屬性用ASP編寫計數器的優化方法基于 Weblogic 7.0 的應用開發以動態模塊的方式安裝apache2.0.44+PHP4.3.0

主站蜘蛛池模板：天天草天天干天天 | 天天操天天爱天天干 | 色姝姝在线影院 | 性a视频 | 欧美一a一片一级一片 | 天天色综合影视 | 欧美中文在线视频 | 欧美在线专区 | 视频一区在线 | 亚洲精品在线播放视频 | 午夜小视频在线观看 | 日本欧美亚洲 | 日本丰满bbb | 庆余年第二部在线观看免费完整版 | 偷窥自拍第1页 | 一级毛片一级毛片一级毛片aaav | 午夜性影院爽爽爽爽爽爽 | 一级黄色片aaa | 亚洲欧美在线一区二区 | 亚洲成人午夜影院 | 亚洲男人的天堂视频 | 欧美一级性 | 日本在线观看中文 | 综合色在线观看 | 婷婷丁香五月中文字幕 | 欧美一级淫片aaaaaaa视频 | 日本a在线播放 | 日本在线视| 日本欧美国产精品第一页久久 | 性色视频在线观看 | 青草青青产国视频在线 | 四虎免费在线视频 | 欧美亚洲一区二区三区在线 | 丝袜美腿护士办公室在线观看 | 天堂8中文在线最新版在线天堂8中文在线bt | 午夜性色视频 | 青草久久精品亚洲综合专区 | 日本黄在线观看 | 亚洲男人的天堂久久香蕉 | 一二三中文乱码亚洲乱码 | 日韩免费一区二区三区 |