在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现
这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。
GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。
GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和
偏移编号都从0xA1开始。
我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表
给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。
a 啊 B0A1
b 芭 B0C5
c 擦 B2C1
d 搭 B4EE
e 蛾 B6EA
f 发 B7A2
g 噶 B8C1
h 哈 B9FE
j 击 BBF7
k 喀 BFA6
l 垃 C0AC
m 妈 C2E8
n 拿 C4C3
o 哦 C5B6
p 啪 C5BE
q 期 C6DA
r 然 C8BB
s 撒 C8F6
t 塌 CBFA
w 挖 CDDA
x 昔 CEF4
y 压 D1B9
z 匝 D4D1
【输入、输出格式要求】
用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。
程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。
字母间不留空格,全部使用大写字母。
例如:
用户输入:
3
大家爱科学
北京天安门广场
软件大赛
则程序输出:
DJAKX
BJTAMGC
RJDS
【注意】
请仔细调试!您的程序只有能运行出正确结果的时候才有机会得分!
在评卷时使用的输入数据与试卷中给出的实例数据可能是不同的。
请把所有函数写在同一个文件中,调试好后,拷贝到【考生文件夹】下对应题号的“解答.txt”中即可。
相关的工程文件不要拷入。
源代码中不能使用诸如绘图、Win32API、中断调用、硬件操作或与操作系统相关的API。
允许使用STL类库,但不能使用MFC或ATL等非ANSI c++标准的类库。
例如,不能使用CString类型(属于MFC类库),不能使用randomize, random函数(不属于ANSI C++标准)
*/
#include <iostream>
using std::cin;
using std::cout;
using std::endl;
#include <iomanip>
using std::hex;
const int g_m = 10;
const int g_n = 30;
char ch[g_m][g_n];
char g_ch1[] = "ABCDEFGHJKLMNOPQRSTWXYZ";
char g_ch2[] = "啊芭擦搭蛾发噶哈击喀垃妈拿哦啪期然撒塌挖昔压匝";
void Input(void);
void Print(const char *);
void Change(unsigned char a[]);
int main()
{
Input();
return 0;
}
void Input(void)
{
int n = 0;
cin>>n;
if(n > g_m)
return;
for(int i = 0; i < n; i++)
{
cin>>ch[i];
}
for(i = 0; i < n; i++)
{
Print(ch[i]);
cout<<endl;
}
}
//从每一句提取出单个汉字,再调用函数Change()来处理这个汉字
void Print(const char *str)
{
unsigned char temp[3];//注意到一个汉字在内存中是以两个字节来存储的,所以
//这里要2个字节来存放,再加上一个空字符。
temp[3] = '\0';
int length = strlen(str);
// cout<<length<<endl;
for(int i = 0; i < length; i+=2)
{
for(int j = 0; j < 2; j++)
{
temp[ j] = str[i+j];
// cout<<hex<<(temp[0]&12)<<" "<<(temp[1]&127+0xA1)<<endl;
}
Change(temp);
}
}
//输出一个汉字的首字母,这里要将汉字的两个字节拆分开来,并与给定的汉字编码来进行比较
void Change(unsigned char a[])
{
int n = strlen(g_ch1);
//如果这个汉字拼音的首字母是以Z开头的
if((a[0] >= (unsigned char)(g_ch2[22*2])) && (a[1] >= (unsigned char)(g_ch2[22*2+1])))
{
cout<<g_ch1[22];
return;
}
// 将一个汉字与每个已知编码的汉字比较
for(int i = 0; i < n; i++)
{
if(a[0] <(unsigned char)(g_ch2[i*2]) )
{
cout<<g_ch1[i-1];
break;
}
//如果这个汉字的编码的高字节的编码和给出的两个汉字的高节字的编码都相同,则进行进一步的比软判断
if((a[0] == (unsigned char)(g_ch2[i*2])) && (a[0] == (unsigned char)(g_ch2[(i+1) *2])))
{
if(a[1]<(unsigned char)(g_ch2[(i+1)*2+1]))
cout<<g_ch1[i];
else
cout<<g_ch1[i+1];
break;
}
//如果只和一个给定的汉字的高字节的编程相同,则再进行进一步的比较判断
if(a[0] == (unsigned char)(g_ch2[i*2]))
{
if(a[1]<(unsigned char)(g_ch2[i*2+1]))
cout<<g_ch1[i-1];
else
cout<<g_ch1[i];
break;
}
}
}
作者:
拼音字母