|
在對 C 語言的編程實(shí)踐中,字符串查找是最頻繁的字符串操作之一,本節(jié)就對常用的字符串查找函數(shù)做一個(gè)簡單的總結(jié)。
使用 strchr 與 strrchr 函數(shù)查找單個(gè)字符如果需要對字符串中的單個(gè)字符進(jìn)行查找,那么應(yīng)該使用 strchr 或 strrchr 函數(shù)。其中,strchr 函數(shù)原型的一般格式如下:
char *strchr(const char *s, int c);
它表示在字符串 s 中查找字符 c,返回字符 c 第一次在字符串 s 中出現(xiàn)的位置,如果未找到字符 c,則返回 NULL。也就是說,strchr 函數(shù)在字符串 s 中從前到后(或者稱為從左到右)查找字符 c,找到字符 c 第一次出現(xiàn)的位置就返回,返回值指向這個(gè)位置,如果找不到字符 c 就返回 NULL。
相對于 strchr 函數(shù),strrchr 函數(shù)原型的一般格式如下:
char *strrchr(const char *s, int c);
與 strchr 函數(shù)一樣,它同樣表示在字符串 s 中查找字符 c,返回字符 c 第一次在字符串 s 中出現(xiàn)的位置,如果未找到字符 c,則返回 NULL。但兩者唯一不同的是,strrchr 函數(shù)在字符串 s 中是從后到前(或者稱為從右向左)查找字符 c,找到字符 c 第一次出現(xiàn)的位置就返回,返回值指向這個(gè)位置。下面的示例代碼演示了兩者之間的區(qū)別:
int main(void)
{
char str[] = "I welcome any ideas from readers, of course.";
char *lc = strchr(str, 'o');
printf("strchr: %s\n", lc);
char *rc = strrchr(str, 'o');
printf("strrchr: %s\n", rc);
return 0;
}
對于上面的示例代碼,strchr 函數(shù)是按照從前到后的順序進(jìn)行查找,所以得到的結(jié)果為“ome any ideas from readers,of course.”; 而 strrchr 函數(shù)則相反,它按照從后到前的順序進(jìn)行查找,所以得到的結(jié)果為“ourse.”。
示例代碼運(yùn)行結(jié)果為:
strchr: ome any ideas from readers, of course.
strrchr: ourse.
最后還需要注意的是,為什么函數(shù)的“c”參數(shù)是 int 類型,而不是“char”類型呢?
其實(shí)原因很簡單,這里用的是字符的 ASCII 碼(因?yàn)槊總(gè)字符都對應(yīng)著一個(gè) ASCII 碼),這樣在傳值的時(shí)候既可以傳“char”類型的值,又可以傳“int”類型的值(0~127)。
使用 strpbrk 函數(shù)查找多個(gè)字符上面的 strchr 與 strrchr 函數(shù)解決了對字符串中單個(gè)字符的查找,那么需要查找多個(gè)字符時(shí)怎么辦呢?
如果要查找多個(gè)字符,就需要使用 strpbrk 函數(shù)了。該函數(shù)在源字符串(s1)中按從前到后順序找出最先含有搜索字符串(s2)中任一字符的位置并返回,空字符 null('\0') 不包括在內(nèi),若找不到則返回空指針。其函數(shù)原型的一般格式如下:
char *strpbrk(const char *s1,const char *s2);
例如,在 strpbrk 函數(shù)的定義如下:
char *strpbrk (const char *s, const char *accept)
{
while (*s != '\0')
{
const char *a = accept;
while (*a != '\0')
if (*a++ == *s)
return (char *) s;
++s;
}
return NULL;
}
如上面的代碼所示,strpbrk 數(shù)首先依次循環(huán)檢查字符串 s 中的字符,當(dāng)被檢驗(yàn)的字符在字符串 accept 中也包含時(shí)(即“if(*a++==*s)”),則停止檢驗(yàn),并返回“(char*)s”。如果沒有匹配字符,則返回空指針 NULL。這里需要注意的是,空字符 null('\0')不包括在內(nèi)。函數(shù)的調(diào)用示例如下面的代碼所示:
int main(void)
{
char str[] = "I welcome any ideas from readers, of course.";
char *rc=strpbrk(str,"come");
printf("%s\n",rc);
return 0;
}
很顯然,示例代碼的運(yùn)行結(jié)果為“elcome any ideas from readers,of course.”。
使用 strstr 函數(shù)查找一個(gè)子串相對于 strpbrk 函數(shù),strstr 函數(shù)表示在字符串 haystack 中從前到后查找子串 needle 第一次出現(xiàn)的位置(不比較結(jié)束符 null('\0')),并返回指向第一次出現(xiàn) needle 位置的指針,如果沒找到則返回 NULL。其函數(shù)原型的一般格式如下:
char *strstr(const char *haystack, const char *needle);
strstr 函數(shù)的調(diào)用示例如下面的代碼所示:
int main(void)
{
char str[] = "I welcome any ideas from readers, of course.";
char *c1=strstr(str, "come");
printf("come:%s\n",c1);
char *c2=strstr(str, "icome");
printf("icome:%s\n",c2);
return 0;
}
這里需要注意的是,因?yàn)?strstr 函數(shù)與 strpbrk 函數(shù)不同,strstr 函數(shù)匹配的是字符串,所以語句“strstr(str,"icome")”將返回 NULL。運(yùn)行結(jié)果為:
come:come any ideas from readers, of course.
icome:(null)
區(qū)別 strspn 與 strcspn 函數(shù)strspn 函數(shù)表示從字符串 s 的第一個(gè)字符開始,逐個(gè)檢查字符與字符串 accept 中的字符是否不相同,如果不相同,則停止檢查,并返回以字符串 s 開頭連續(xù)包含字符串 accept 內(nèi)的字符數(shù)目。其函數(shù)原型的一般格式如下:
size_t strspn(const char *s, const char *accept);
例如,該函數(shù)的定義如下:
size_t strspn (const char *s,const char *accept)
{
const char *p;
const char *a;
size_t count = 0;
for (p = s; *p != '\0'; ++p)
{
for (a = accept; *a != '\0'; ++a)
if (*p == *a)
break;
if (*a == '\0')
return count;
else
++count;
}
return count;
}
從上面的示例代碼中可以看出,strspn 函數(shù)從字符串參數(shù) s 的開頭計(jì)算連續(xù)的字符,而這些字符完全是 accept 所指字符串中的字符。簡單地說,如果 strspn 函數(shù)返回的數(shù)值為 n,則代表字符串 s 開頭連續(xù)有 n 個(gè)字符都屬于字符串 accept 內(nèi)的字符。
函數(shù)的調(diào)用示例如下面的代碼所示:
int main(void)
{
char str[] = "I welcome any ideas from readers, of course.";
printf("I wel:%d\n",strspn(str,"I wel"));
printf("Iwel:%d\n",strspn(str,"Iwel"));
printf("welcome:%d\n",strspn(str,"welcome"));
printf("5:%d\n",strspn(str,"5"));
return 0;
}
在上面的示例代碼中,因?yàn)?strspn 函數(shù)返回的是以字符串 s 開頭連續(xù)包含字符串 accept 內(nèi)的字符數(shù)目。而源字符串 str 中的“I”與“welcome”之間有一個(gè)空格(即“I welcome”),所以,語句“strspn(str,"Iwel")”將返回 1,而語句“strspn(str,"I wel")”將返回 5。因此,輸出結(jié)果為:
I wel:5
Iwel:1
welcome:0
5:0
相對于 strspn 函數(shù),strcspn 函數(shù)與之相反,它表示從字符串 s 第一個(gè)字符開始,逐個(gè)檢查字符與 reject 中的字符是否相同,如果相同,則停止檢查,并返回以字符串 s 開頭連續(xù)不含字符串 reject 內(nèi)的字符數(shù)目。其函數(shù)原型的一般格式如下:
size_t strcspn(const char *s, const char *reject);
該函數(shù)的定義如下:
size_t strcspn (const char *s,const char *reject)
{
size_t count = 0;
while (*s != '\0')
if (strchr (reject, *s++) == NULL)
++count;
else
return count;
return count;
}
從上面的代碼中不難發(fā)現(xiàn),strcspn 函數(shù)正好與 strspn 函數(shù)相反。strcspn 函數(shù)從字符串參數(shù) s 的開頭計(jì)算連續(xù)的字符,而這些字符都完全不在參數(shù) reject 所指的字符串中。簡單地說,如果 strcspn 函數(shù)返回的數(shù)值為 n,則代表字符串 s 開頭連續(xù)有 n 個(gè)字符都不包含字符串 reject 內(nèi)的字符。
函數(shù)的調(diào)用示例如下面的代碼所示:
int main(void)
{
char str[] = "I welcome any ideas from readers, of course.";
printf("I wel:%d\n",strcspn(str,"I wel"));
printf("Iwel:%d\n",strcspn(str,"Iwel"));
printf("welcome:%d\n",strcspn(str,"welcome"));
printf("5:%d\n",strcspn(str,"5"));
return 0;
}
在上面的示例代碼中,因?yàn)?strcspn 函數(shù)返回的是以字符串 s 開頭連續(xù)不包含字符串 accept 內(nèi)的字符數(shù)目。因此,其運(yùn)行結(jié)果為:
I wel:0
Iwel:0
welcome:2
5:45
由此可見,對于 strspn 函數(shù),如果找到了 reject 與 s 不相同元素時(shí),指針停止移動(dòng),并返回以字符串 s 開頭連續(xù)包含字符串 accept 內(nèi)的字符數(shù)目;而 strncspn 函數(shù)則是找到了 reject 與 s 相同元素時(shí),指針停止移動(dòng),并返回以字符串 s 開頭連續(xù)不包含字符串 accept 內(nèi)的字符數(shù)目。這一點(diǎn)一定要注意,千萬不要混淆了。
|
|