首页 新闻 社团 无厘 文学 入党相关 演 讲 稿 免费论文 校园影音 浪漫祝福 许愿树 电影 点歌 彩信
图话 MyIT 数码 交易 兼职 求职简历 自 荐 信 两性知识 小 游 戏 地图导航 急转弯 家教 博客 交友
校园网QQ群:8604330
公 告:     此频道正在建设当中........        

 | 网站首页 | 青春校园 | 信息 | 论文 | 祝福 | 自创影音 | 两性 | 小游戏 | 日记本 | 校园论坛 | 

您现在的位置: 龙江校园网 >> 论文 >> 理工类 >> 计算机 >> 其它计算机 >> 论文正文 用户登录 新用户注册
怎样从二进制流中恢复汉字信息         【字体:
怎样从二进制流中恢复汉字信息
作者:佚名 文章来源:网络整理 点击数: 更新时间:2007-7-22 18:35:09
摘  要:本文介绍了汉字的存储和处理原理,通过几段典型的程序介绍了从二进制流中恢复汉字时常见的问题及解决的办法。

    关键词:汉字  处理  编程

  我们处理的字符信息,通常是中英文混排的,有时处理不当,会出现汉字不能正常显示的现象。这主要是由于不了解汉字的存储原理和处理原理,以及处理时未考虑汉字的特点造成的。
    1 ASCII码和汉字内码
    字符被计算机处理时都是以二进制码的形式出现的,即一个字符对应一个8位二进制数。这种二进制码的集合就是所谓的ASCII码。

    基本的ASCII码有128个,最高位都是0,对应的十进制数是0-127。键盘上的字符,如英文字母、数字和一些常用符号,使用基本ASCII码部分。如,数字“0”的ASCII码用二进制数表示就是00110000(即十进制数48)。

    扩展的ASCII码有128个,最高位都是1,对应的十进制数是128-255。一些制表符和其它符号使用扩展ASCII码部分。

    为解决汉字的存储和显示问题,我国制定了国标GB2312,根据GB2312的规定,一个汉字由两个扩展ASCII码组成。这种高位为1的双字节汉字编码就是汉字的机内码,简称为内码。如,汉字“学”的机内码用二进制数表示就是11010001 10100111(即十进制数209和167),用十进制表示就是53671(209×256+167)。

    对于字符,计算机存储和处理的是它的ASCII码,对于汉字,计算机存储和处理的是它的内码,即两位ASCII码。如,字符串“0学0”在计算机中存储的内容是00110000 11010001 10100111 00110000。

  2 几个处理字符的程序
  2.1 将二进制流恢复成正常字符串的VB程序
    下面的一段VB程序以二进制方式打开一个文本文件,再将文本文件内容送入一个二进制数组。
    ‘<程序1>
    Dim X() As Byte, L As String
    Open App.Path & "\aa.txt" For Binary Access Read As #1      ‘以二进制方式打开文本文件aa.txt
    L = LOF(1)                                                                        ‘取文本文件字节数
    ReDim X(L - 1)                                                                  ‘重定义二进制数组
    Get #1, , X                                                                  ‘将文件内容读入二进制数组
    Close #1                       &nbs

[1] [2] [3] 下一页

论文录入:admin    责任编辑:admin 
  • 上一篇论文:

  • 下一篇论文:
  • 【校园论坛】发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    专 题 栏 目

    最 新 热 门
    最 新 推 荐
    相 关 文 章
    没有相关论文
      热门图片

    没有任何图片论文
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)