自动识别串口接收的文本编码格式BIG5,unicode,GB2312等...

2019-12-15 11:46发布


通过程序怎么实现自动识别串口接收的数据是GB2312还是unicode,BIG5的编码格式?
本人通过识别到的编码格式,进行LCD显示。

就是让自己的设备支持多种编码格式;支持GB2312,UNICODE,BIG5等;
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
17条回答
richards
1楼-- · 2019-12-16 04:46
如果你自己的设备的话 可以做,协议上做 前2个字符发送固定的字符
not_at_all
2楼-- · 2019-12-16 08:33
参照系统自带的TXT记事本。
没有数据头的话,根本无解,除非你搞一套算法区分。
tangnyzl
3楼-- · 2019-12-16 13:43
我看好你,努力去实现吧,哈哈。
t3486784401
4楼-- · 2019-12-16 15:20
本帖最后由 t3486784401 于 2018-6-13 18:16 编辑

Windows 下 GB2312 和 Unicode 之间互换用的是这么两个 API 函数:

#1:GB2312 -> Unicode
  1. int MultiByteToWideChar(
  2.   UINT CodePage,         // code page
  3.   DWORD dwFlags,         // character-type options
  4.   LPCSTR lpMultiByteStr, // string to map
  5.   int cbMultiByte,       // number of bytes in string
  6.   LPWSTR lpWideCharStr,  // wide-character buffer
  7.   int cchWideChar        // size of buffer
  8. );
复制代码

#2:Unicode -> GB2312
  1. int WideCharToMultiByte(  UINT CodePage,            // code page
  2.   DWORD dwFlags,            // performance and mapping flags
  3.   LPCWSTR lpWideCharStr,    // wide-character string
  4.   int cchWideChar,          // number of chars in string
  5.   LPSTR lpMultiByteStr,     // buffer for new string
  6.   int cbMultiByte,          // size of buffer
  7.   LPCSTR lpDefaultChar,     // default for unmappable chars
  8.   LPBOOL lpUsedDefaultChar  // set when default char used);
复制代码

实际使用过程中还牵涉到乱码字符处理等问题。至于 BIG5 目前没研究过。UTF-8 的话,可以通过移位换算转到 Unicode。
如果在 Windows 端做这些转换的话,倒还是有现成的 API;你要是嵌入端搞的话,目测只剩下查表了。

搜索下载全部的(或者常用的)汉字字符集,分别另存为 GB2312/Unicode/BIG5 等,然后自己做成表格,也就几十 kB 的空间。

P.S. 发一段以前做的 GBK->UTF8 的字典加载程序,可以把其中 GBK 的码抽出来作为字符集用: gbk_utf8.rar (116.36 KB, 下载次数: 11) 2018-6-13 18:15 上传 点击文件名下载附件

-------------------------------------------------------------------------------------

编辑原因:追加字符集源码
xianghaisha
5楼-- · 2019-12-16 18:47
 精彩回答 2  元偷偷看……
XA144F
6楼-- · 2019-12-16 21:44
fatfs文件系统的cc936文件中的函数,你没用过吗?

一周热门 更多>