strConv函数，求解释！解决方法

2012-03-09

strConv函数，求解释！小弟对该函数不慎明了，求解释！[解决办法]Unicode vs AnsiVisual Basic 32-bit 版本的

strConv函数，求解释！
小弟对该函数不慎明了，求解释！

[解决办法]
Unicode vs Ansi

Visual Basic 32-bit 版本的字串处理采用 Unicode，也就是说字串在 VB 内部是以
Unicode 的格式来存放。

何谓 Unicode？简单的说，就是每一个字元都是以 2-byte 的型式表示，而每个「实
体字元」就是一个「字元」。因此，

Len("大家好")
Len("abc")

所传回的值都是 3，因为「大」和「a」都是一个字元。

但是这对一些中文字串处理，例如纯文字的资料档，却是一个大灾难，因为你必须以
byte 来定位每个字元，可是 Unicode 却把一切的处理全搞砸了。例如：

Len("Good Morning") 传回 12，而
Len("今天天气很好") 传回 6

对初学者而言，好不容易能使用 VB 来写程式已经是件了不起的事了，却马上在中文
处理上挨了一记闷棍，所受到的打击实在不小。但是不要怕，事实上只要再多了解一
些指令，就可以把中文处理的问题解决了。

是什麽指令呢？最重要的莫过於 StrConv 了。StrConv 函式的语法为：

StrConv(待转换字串, 转换格式)

其中转换格式在这里用到的是：

vbUnicode 将 Ansi 字串转换为 Unicode
vbFromUnicode 将 Unicode 字串转换为 Ansi

将字串转成 Ansi 之後，所有的字串处理指令都要加个 B，例如：LeftB, RightB,
MidB, ChrB, InstrB, LenB, InputB 等。例用这些指令来处理就行了。

当你处理完毕之後，你可以再将它再转回 Unicode，这样就可以使用一般的字串处理
指令了。

这样讲看得懂吗？如果还是不了解，看看下面的实例说明：

[●] 简易使用范例

看看下面的基本范例您应该就会对 VB 的字串处理方式有些概念。

Private Sub Command1_Click ()
Dim sUnicode As String
Dim sAnsi As String

' Unicode 运算
sUnicode = "王小明,A123456789,651023,台北市中山路100号,(02)2345678"
Debug.Print Len(sUnicode) ' 传回 44
Debug.Print Mid$(sUnicode, 5, 10) ' 传回 A123456789
Debug.Print Instr(sUnicode, "台北市") ' 传回 23

' 将 Unicode 字串转成 Ansi
sAnsi = StrConv(sUnicode, vbFromUnicode)
' Ansi 运算
Debug.Print LenB(sAnsi) ' 传回 54
Debug.Print MidB$(sAnsi, 8, 10) ' 传回 ?????，因为忘了转回 Unicode
Debug.Print StrConv(MidB$(sAnsi, 8, 10), vbUnicode) ' 传回 A123456789，请注意转回 Unicode 的动作一定要做
Debug.Print InStrB(sAnsi, StrConv("台北市", vbFromUnicode)) ' 传回 23, 不要忘了要把"台北市"也转成 Ansi，否则会找不到
End Sub

[●] 读入文字档

在 VB 的小技巧中，有一个是快速读档法：

Private Sub Command1_Click ()
Dim sFile As String

Open "C:\filename.txt" For Input As #1
sFile = Input$(LOF(1), #1)
Close #1
End Sub

但是很不幸地，如果你读取的档案内含中文字，那上面这段程式会出现 Input past
end of file 的错误。因为 LOF 传回的是档案的 byte 数，而 Input 函式读取的是
字元数，由於档案内含中文，因此档案中的字元数将会小於 byte 数，於是就发生错
误了。

要解决这个问题，我们就要用到 StrConv 和 InputB 这两个函式了：

Private Sub Command1_Click ()
Dim sFile As String

Open "C:\filename.txt" For Input As #1
sFile = StrConv(InputB$(LOF(1), #1), vbUnicode)
Close #1
End Sub

上面修正程式先用 InputB 将档案读进来，不过使用 InputB 所读入的档案是 Ansi
格式的，所以要再用 StrConv 转成 Unicode 才行。

[●] 随机资料档

许多文字资料档是以固定位元组的位置来加以区格，例如下面的资料格式：

王小民650110台北市中山路100号 (02)1234567
张大呆660824花莲县大甲镇广东街23号(03)9876543
......

像这种类型的档案要如何处理呢？这是就必须用到 Type 以及 byte array 了。

Private Type tagRecord
Username(5) As Byte ' 姓名 6 bytes
Birthday(5) As Byte ' 生日 6 bytes
Address(21) As Byte ' 地址 22 bytes
TEL(11) As Byte ' 电话 12 bytes
CrLf(1) As Byte ' 换列字元 2 bytes
End Type

Private Sub Command1_Click()
Dim uRecord As tagRecord

Open "C:\filename.dat" For Random As #1 Len = LenB(uRecord)
Get #1, 2, uRecord ' 取第二笔资料

With uRecord ' With ... End With 应该会用吧
Debug.Print .Username ' 传回 ???
Debug.Print StrConv(.Username, vbUnicode) ' 传回 "张大呆"
End With

Close #1
End Sub

在这个例子中，一定要用到 byte array，因为只有 byte array 才能正确地定位到每
个 byte 的位置。以前使用字串来定位的方法已经不适用了，千万要记住！但是使用
byte array 所读入的资料是 Ansi 格式，若要处理或是做运算的话，记得还要转成
Unicode 格式才行。

[●] 使用 Byte Array

除了上面必须使用 byte 精确定位的例子之外，纯文字的处理基本上是用不到 byte
array 的。byte array 通常是用在处理 binary 资料。

[解决办法]
编码转换，这是好理解的，不过要真正理解最好还是弄几张不同的码表来看看,unicode,Ansi(ascii+GB2312,大陆），里面最让人闹心的是unicode,容易让人混淆了，utf-8,utf-16,utf-32这些都是unicode的实现方式，编码是不同的，VB用的是utf-16（这也按字节序分为了两种，utf-16LE,utf-16BE)

Strconv(...,vbunicode) 把ansi码(ascii+GB2312,大陆，根据系统码页指定的，或第三个参数）转为unicode(事实上是utf-16LE,希望没说错吧，记不清了，不过utf-16是真的）；

Strconv(...,vbfromunicode) 和上面过程相反，把utf-16转为Ansi

最后说明一下,Ansi也不是一种编码，应该是Ascii+本地编码(由系统码页指定的），这就是为什么会有第三个参数的原因。
[解决办法]

引用 msdn
StrConv 函数

返回按指定类型转换的 Variant (String)。

语法

StrConv(string, conversion, LCID)

StrConv 函数的语法有下面的命名参数：

部分说明
string 必要参数。要转换的字符串表达式。
conversion 必要参数。Integer。其值的和决定转换的类型。
LCID 可选的。如果与系统LocaleID不同，则为LocaleID（系统LocaleID为缺省值。）

设置值

conversion 参数的设置值为：

常数值说明
vbUpperCase 1 将字符串文字转成大写。
vbLowerCase 2 将字符串文字转成小写。
vbProperCase 3 将字符串中每个字的开头字母转成大写。
vbWide* 4* 将字符串中单字节字符转成双字节字符。
vbNarrow* 8* 将字符串中双字节字符转成单字节字符。
vbKatakana** 16** 将字符串中平假名字符转成片假名字符。

vbHiragana** 32** 将字符串中片假名字符转成平假名字符。
vbUnicode 64 根据系统的缺省码页将字符串转成 Unicode。
vbFromUnicode 128 将字符串由 Unicode 转成系统的缺省码页。

*应用到远东国别。

**仅应用到日本。

注意这些常数是由 VBA 指定的。可以在程序中使用它们来替换真正的值。其中大部分是可以组合的，例如 vbUpperCase + vbWide，互斥的常数不能组合，例如 vbUnicode + vbFromUnicode。当在不适用的国别使用常数 vbWide、vbNarrow、vbKatakana，和 vbHiragana 时，就会导致运行时错误。

下面是一些一般情况下的有效分界符：Null (Chr$(0))，水平制表符 (Chr$(9))，换行 (Chr$(10))，垂直制表符 (Chr$(11))，换页 (Chr$(12)) ，回车 (Chr$(13))，空白 (SBCS) (Chr$(32))。在 DBCS中，空白的实际值会随国家/地区而不同。

说明

在把 ANSI 格式的 Byte 数组转换为字符串时，您应该使用 StrConv 函数。当您转换 Unicode 格式的这种数组时，使用赋值语句。

热点排行