wstring,WCHAR,TCHAR,CHAR_tchar转wstring_oocean1的博客

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

忧郁的烤土司 · 斗罗大陆有声下载资源 - 百度· 5 月前 ·

重感情的生姜 · python tkinter ...· 8 月前 ·

八块腹肌的柑橘 · 爱奇艺尖叫之夜2023嘉宾有哪些(完整名单) ...· 10 月前 ·

年轻有为的啄木鸟 · 殷勇会见国际商会国际仲裁院主席_外事要闻 ...· 1 年前 ·

微笑的手套 · 想买五菱宏光MINI ...· 1 年前 ·

写在这里备忘。自己在写一个通过文件名查找文件夹（包含子文件夹）下的文件，并找到相应文件的绝对路径并写入txt文件的程序时看到的一些资料以及感悟。

1.将wstring输入到txt文件的操作

<span style="font-size:12px;">#include "stdafx.h"
#include <string>
#include <fstream>
using namespace std;
int _tmain(int argc, TCHAR* argv[], TCHAR* envp[])
	wstring result = L"Hell你好,世界！！！World!";
	wofstream f;
	locale oldLocale1 = f.imbue(locale(std::locale("chs"),"",LC_CTYPE));//为了对中文操作
	f.open(L"F:\\11.txt", wios::app);
	f <<result.c_str()<<endl;
	f.close();
	f.imbue(oldLocale1);<span style="font-family: Arial, Helvetica, sans-serif;">//为了对中文操作</span>
	return 0;
</span>

<span style="font-size:12px;">
</span>

<span style="font-size:12px;">
</span>

2.对const char * 类型转换到TCHAR*,用函数_T();或者_TEXT();但记得加上头文件tchar.h

如将"*.*"的转换即用_T("*.*");

3.对于LPCTSTR（const TCHAR*）可先转换为wstring类型，然后push 进vector

比如 vector<LPCSTR> vecPath;

LPCSTR szPath="......";

vecPath.push_back(szPath);//大量数据时将会出错，push进的数据一部分为乱码，不知道为什么？

解决办法：

wstring str=szPath;

vector<wstring>vecPath;

之后再试没有出现数据的改变；

4.WCHAR,TCHAR,CHAR区别

转自：http://blog.csdn.net/scollins/article/details/5657957

C++的字符分成两种类型wchar_t和char。
其中 WCHAR==wchar_t，CHAR==char。
TCHAR是一种条件编译的类型，根据条件可以代表wchar_t或char。

#ifdef   UNICODE
typedef   wchar_t   TCHAR;
#else
typedef   unsigned   char   TCHAR;
#endif

typedef unsigned char CHAR;
typedef unsigned wchar_t WCHAR;

CHAR为单字节字符。还有个WCHAR为Unicode字符，即不论中英文，每个字有两个字节组成。如果当前编译方式为ANSI(默认)方式，TCHAR等价于CHAR，如果为Unicode方式，TCHAR等价于WCHAR。在当前版本LPCSTR和LPSTR没区别，即以零结尾的字符串指针，相当于CHAR *。 LPSTR、LPCSTR相当于char *，所以这种类型变量的赋值等同于char *的赋值。

Ex1: LPSTR lpstrMsg = "I'm tired.";
Ex2: char strMsg[]="I'm tired.";
LPSTR lpstrMsg = (LPSTR) strMsg;

unsigned short * 和 char* : 一个是宽字符，一个是多字节，两种编码是不一样的。

如果你的程序要想在全球发布，一定要使用宽字符Unicode，

TChar strFileName[MAX_PATH] = TEXT("");
char strFileName[MAX_PATH]="";

TEXT就是L
有点象这样：
#define TEXT(str) L##str
##是连接的意思就是将L和str联在一起了，表示宽字符。
L"Hello World",和"Hello World"是不同的，前一个占用24个char,后一个占用了12个char
如果定义了
#define UNICODE
TCHAR就代表宽字符wchar（2*sizeof(char)）,否则TCHAR就代表char

也就是说在有
#define UNICODE
的情况下

TChar strFileName[MAX_PATH] = TEXT(""); //代表定义了一个空的宽字符串
char strFileName[MAX_PATH]="";//代表定义了一个ASCII字符串

如果没有定义#define UNICODE那么
TChar strFileName[MAX_PATH] = TEXT(""); //编译器似乎会报错，没尝试过
char strFileName[MAX_PATH]="";//代表定义了一个ASCII字符串

int len=0;
char *temp;
strcpy(temp,"hello");
len=strlen(temp);
char *unicodechar; //不一定是char*型，应该是什么型
int unicodelen;
//如何把temp=>unicodechar，并且长度为unicodechar的byte长度
比如
temp="a" len=1
unicodechar=0x000x61 unicodelen=2;

将ANSI转换到Unicode
(1)通过L这个宏来实现，例如: CLSIDFromProgID( L"MAPI.Folder",&clsid);
(2)通过MultiByteToWideChar函数实现转换,例如:
char *szProgID = "MAPI.Folder";
WCHAR szWideProgID[128];
CLSID clsid;
long lLen = MultiByteToWideChar(CP_ACP,0,szProgID,strlen(szProgID),szWideProgID,sizeof(szWideProgID));
szWideProgID[lLen] = '/0';
(3)通过A2W宏来实现,例如:
USES_CONVERSION;
CLSIDFromProgID( A2W(szProgID),&clsid);

char to TCHAR , TCHAR to char

在编写Wince程序时，遇到了一个问题如下：有的函数的返回值是char型的，如何将其转换成Tchar型，比如列举注册表函数RegEnumValue()返回的值中，有一个返回值是得到指定键的值。它是BYTE（unsigned char）型的，如何将其很容易的转成Tchar型，用了函数MultiByteToWideChar()，但是总是只转第一个字符，不知道哪里出了问题？
答：可以把BYTE的值赋给CString变量，再用wcscpy函数把CString变量的值赋给TCHAR数组。
ANSI to Unicode:
--------------------------------------------------
char *pAnsiString = "Some test string";
CString strUnicode = pAnsiString;
---------------------------------------------------

如何把 char 转为lpctstr
mbstowcs---Convert a multi-byte(ANSI) string to wide character stirng(Unicode).
wcstombs---Convert a wide character string to multi-byte string.

--------------------------------------------------

cstring TCHAR的互相转换

cstring－>TCHAR*的转化可以用函数GetBuff()

函数原型为：LPTSTR GetBuffer( int nMinBufLength );
cstring str("cstring");
TCHAR* szMsg = new TCHAR[100];
//其参数为cstring字符串的长度
szMsg = str.GetBuffer(str.GetLength());
str.ReleaseBuffer();
delete []szMsg;
szMsg = NULL;

TCHAR*－>cstring的转化

TCHAR szTchar[18] = L"TCHAR";
cstring str;
str.Format(_T("%s"),szTchar);
-------------------------------------------------------------
Unicode to ANSI:
char* GetAnsiString(const CString &s)
{
int nSize = s.GetLength();
char *pAnsiString = new char[nSize+1];
wcstombs(pAnsiString, s, nSize+1);
return pAnsiString;
}
CString strUnicode = _T("Some test string");
char *pAnsiString = GetAnsiString(strUnicode);

5.WCHAR 的相关操作

转自：http://www.cppblog.com/shongbee2/archive/2009/04/28/81349.html

http://hi.baidu.com/shongbee2/blog/item/207925546b6cdd5fd10906e0.html
http://hi.baidu.com/shongbee2/blog/item/d4a057511e9539878c5430cb.html
看了之后我才发现原来有wcsXXX的函数专门处理宽字节的，就是strXXX一样好使。呵呵，我不再惧怕了，就试着自己写了一下，还是学了蛮多东西的：
1.有wcsXXX的函数和strXXX的函数对应处理宽字节，wcslen就是求长度的，wcscmp就是比较两个字符串的。
2.输出也有相关的操作，wprintf(L”%s%s”);这样的操作，对文件也可以用fwprintf函数来输出。不过我发现貌似cout << wchar；不成功。也发现了一个问题，就是我输出”相等”这样一个字符串的时候，发现居然输出不正确，无论是控制台和文件都有错误。可见，这个还是有点小问题的。输出其他的例如”12345”等都是正常的。哎，这个函数并不可靠啊。
3.宽字节和普通串的转换问题，学了两个函数，一个是：
wcstombs(char* strDes, const wchar*, size_t nMax);这个函数的作用是把wchar转换为char。
char* strDes 为保存转换后的普通字符串，wchar* 要被转换的宽字符串。转换的最大长度。这里的长度是转换的个数，而不是字节长度。
mbstowcs() 就是一个相反的过程了，参数就不说了。

另一套转换的函数是：
int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cbMultiByte,
LPCSTR lpDefaultChar,
LPBOOL lpUsedDefaultChar
);
他的参数很多，上面的连接有介绍，这里就不怎么细说了。
第一个是编码的方式，我一般用CP_ACP。第二个是转换标志，MSDN上说什么都不设置更快，然后我就什么都不管了就用NULL了。具体作用不知道，等遇到了再学。第三个参数就是被转换的字符串，第四个参数是该字符串的长度，-1表示自动算长度，如果是手动给出，一定要把最后的终结符长度也算上。我觉得还是-1来的实际。第五个参数就是保存转换串的指针，第六个参数就是保存串的长度，这里是单位字符的个数。如果转换的时候没有终结符，那么结果也没有终结符，要注意下。最后两个参数就是默认的填充字符和是否使用了默认填充字符，我一般就用NULL代替。

普通串转宽字节也是类似。
这里有几个注意的，一定要保证空间足够。还有就是那个长度是单位字符个数，而不是字节数，在转换时，推荐被转换的字符串长度设置为-1,因为这样他会自动算出终结符结束。返回值也是转换的单位字符个数。例如”相等”有普通串转换为宽字节串，返回结果是3，（有终结符），而反过来就是5。如果返回时0 说明转换失败。

心得：虽然WideCharToMultiByte的参数要多，感觉用的没有wcstombs爽，可是他的准确好高一些，要转换的话，还用用WideCharToMultiByte比较合适，还有就是虽然有一套wcsXXX的库函数，可惜输出还是出现问题的。如果全都用宽字节，那没有关系wcsxxx的函数还是蛮好用的。还有一个疑惑我明明查字典multi是多的意思也就是说multibyte是多字节，我的中文版VS2005配置里面也是说的多字节。搞不懂为什么要用宽字节呢？可能是多字节编码不好用吧。呵呵。废话也说完了，奉上源代码：

#include <iostream>
#include <fstream>
#include <windows.h> using namespace std; int main()
FILE* fp ;
WCHAR wchar[5] = L"相等相等"; 定义一个宽字节的变量，初始为"相等"
fp = fopen("1.txt", "w+"); 打开文件称奥做
fwprintf(fp, L"%s\n", wchar); 输出到文件
fclose(fp);
WCHAR wc2[5]; 定义第二个宽字节变量

wc开始的有很多宽字节的操作。都和str相对应。
wcscpy(wc2, wchar); int n = wcscmp(wc2, wchar); if (n == 0)
wprintf(L"相等\n"); 这里是否注意到没有wprintf有问题的。 char str[10]; 定义char字符。
n = wcstombs(str, wc2, 9); 宽字节转换为muiltychar
printf("%s\n", str); for ( int i = 0; i < 5; ++i)
wc2[i] = L'1' + i;
wc2[4] = 0;
n = wcstombs(str, wc2, 9); 宽字节转换为muiltychar
printf("%s\n", str); 另外的方式转换
n = WideCharToMultiByte(CP_ACP, NULL, wchar, wcslen(wchar) + 1, str, 10, 0, 0);
printf("%s\n", str); char str2[10] = "加一";
WCHAR wc3[10];
n = MultiByteToWideChar(CP_ACP, NULL, str2, strlen(str2) + 1, wc3, 10); char到宽字节。
system("pause"); return 0; public: void FindFiles(LPCTSTR szPath, std::vector<wstring>& vecPath); vector<wstring> vecPath_absolute; VOID FindFilePath::FindFiles(LPCTSTR szPath, std::vector<wstring>& vecPath) HANDLE hFind(NULL); WIN32_FIND_DATAW FindFileData; BOOL bNext = TRUE; vector<WCHAR*> vecPath_absolute_period; TCHAR szFind[MAX_PATH]; int i=0; lstrcpy(szFind, szPath); lstrcat(szFind,_T ("\\*.*")); // 找所有文件 hFind = FindFirstFileW(szFind, &FindFileData); if (hFind != INVALID_HANDLE_VALUE) //cout<<"read success"<<endl; while (bNext) if (wcscmp(FindFileData.cFileName, L".") == 0 || wcscmp(FindFileData.cFileName, L"..") == 0)//文件夹直接跳过 bNext = FindNextFileW(hFind, &FindFileData); continue; if (FindFileData.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY)//是目录的话 WCHAR szFolder[MAX_PATH]; if (szPath[wcslen(szPath) - 1] == '\\')//路径设置到下一级 swprintf(szFolder, L"%s%s", szPath, FindFileData.cFileName); swprintf(szFolder, L"%s\\%s", szPath, FindFileData.cFileName); FindFiles(szFolder, vecPath);//递归找下级文件 bNext = FindNextFileW(hFind, &FindFileData); continue; wstring str = FindFileData.cFileName; vecPath.push_back(str); //vecPath_absolute.push_back(szPath);//why?? wstring str1=szPath; vecPath_absolute.push_back(str1); bNext = FindNextFileW(hFind, &FindFileData); FindClose(hFind); int main() //WCHAR szPath_src[MAX_PATH] = L"C:\\Users\\dhy\\Desktop\\baseball_with_impact"; WCHAR szPath_src[MAX_PATH] = L"C:\\Users\\ocean\\Desktop"; WCHAR szPath_dest[MAX_PATH]=L"D:\\Document"; //WCHAR szPath_dest[MAX_PATH] = L"C:\\Data\\User_uploaded_videos\\20150330\\baseball\\*.*"; std::vector<wstring> vecfilename_dest; std::vector<wstring> vecfilename_src; FindFilePath src,dest; src.FindFiles(szPath_src, vecfilename_src); dest.FindFiles(szPath_dest, vecfilename_dest); //wfstream out("C://Users//dhy//Desktop//baseball_with_impact//folder_list.txt",ios::out); wofstream out; out.open("folder_list.txt",wios::out); locale oldlocale=out.imbue(locale(locale("chs"),"",LC_CTYPE));//汉字可显 if (!out.is_open()) cout<<"cannot find the txt"<<endl; return 0; vector <wstring>::iterator it_src,it_dest; vector<wstring>::iterator it_path_dest ; for (it_src=vecfilename_src.begin();it_src!=vecfilename_src.end();it_src++) for(it_dest=vecfilename_dest.begin(),it_path_dest=dest.vecPath_absolute.begin();it_dest!=vecfilename_dest.end();it_dest++,it_path_dest++) if(wcscmp(it_dest->c_str(),it_src->c_str())==0) cout<<"find "<<endl; out<<it_path_dest->c_str(); out<<"\\"; out<<it_dest->c_str(); out<<endl; continue;//找到之后跳出循环下一个,假定只有一个同样文件 out.close(); out.imbue(oldlocale);//可显示汉字 return 0; string 、w string 、c string 、 char 、 t char 、int、dword 转换方法( 转 ) 最近编程一直头痛这集中类型的转化，明知都可以转却总是记不住，不断的上网查来查去，在这里小结一下。以备以后方便使用，当然有些方法可能不是最新的，或者最简单的，但是对于自己已经了解的使用起来应该方便的多： 1》 string 转 w string w string s2ws(cons... 标签： string w string w char _t char c++2013-12-19 00:29 3721人阅读评论(0) 收藏举报本文章已收录于： C++知识库分类： C/C++（50） 1. char *-> string (1)直接转换 const char * nodename； string temp = nodename; string temp2(nodename);2. ... 功能：配置地域化信息头文件：< locale.h>函数原型： char * setlocale(int category, const char * locale)函数参数：category表示对本地化的某项内容进行设置，可取如下值：LC_ALL 包括下面的全部选项都要；LC_COLLATE 配置字符串比较；C_CTYPE 配置字符类别及转换，例如全变大写strtoupper()；LC_MONETARY 配置金融货币；LC_NUMERIC 配置小数点后的位数；众所周知TXT文件的编码分为ASCI、UNICODE、UTF8，其中UNICODE又分big-endian、little-endian，具体怎么区分它们可以参照TXT文件的BOM； Byte Order Mark。BOM是一个有点小聪明的想法：在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不因项目需要，涉及到unsigned char *和 string 和unsigned char []的相互转换，记录一下各种方法： ** string 转为unsigned char **[] string str = "ABCDE"; unsigned char ch[16] = {0}; /*注意：当字符串中部存在\0时，以下方法拷贝到字符数组中均会被截断*/ strcpy(( char *)ch, str.c_str()); strncpy(( char *)ch, str.c_str(), str.length( C++中 unsigned char *不能强制转换为 string 类型如果unsigned char *中包含’\0’字符，可以通过以下方式进行转换以不丢失数据 unsigned char szSrc[] = {0x32, 0x00, 0x00, 0x99, 0x34, 0x00, 0x62}; int ilen = sizeof(szSrc)/sizeof(szSrc[0]); string sd... unsigned char * pBuf = evbuffer_pullup(req->input_buffer, -1); vector<unsigned char > vctB... #include//标准C++； string tp; w char _t *s; char *d; tp=s; d=tp.c_str(); 也可使用Wide Char To String (w char _t * Source);函数转换 Wide Char ToMultiByte MultiByteToWide Char LPSTR = char * LPCSTR = const char * LPWSTR = w char _t *