关于标准c中的strtok和linux库里面的strsep

来源:互联网 发布:淘宝企业店铺开通费用 编辑:程序博客网 时间:2024/06/10 04:17
strsep
函数原型:
     
Char * strsep(char **s1, const char *delimt); 
需要注意:
1、         被分割字串要被改变,所以不能操作存放在静态存储区的字串常量。
2、        分割符要被替换成’\0’。
3、        需要传二级指针,因为s1是指向分割字串,第一次指向源字串,调用后指向分割后的下一个token。所以s1会改变,需要传递二级指针。
对于注意1,常犯错误如下:
char *str = "This is a example to test the function of strsep";  
strsep(&str, " "); 
str指向的字串是静态存储区,属于字符串常量,不能修改。会出现段错误。
而对于注意3,常犯错误如下:
 
char str[] = "This is a example to test the function of strsep";  
strsep(&str, " "); 
&str是一级指针,所以也会出现段错误。
       其实对于会修改源字串的函数都容易出现上面的错误。用时要格外小心注意。
strtok也跟strsep一样,是用来分割字符串的,但不同的是strtok把待分割字串和遍历指针分开,并且遍历指针也是内置的。但是strsep把待分割字串和内置指针整合,所以需要传二级指针。
函数原型:
char *strtok(char *s1, const char *delim); 
同样注意上面的错误地方。
strtok要对同一字串进行多次分割,第一次需要指定源字串,接下来需要传NULL;而strsep则不需关心这个问题,因为它是把待分割字串的二级指针传过去,内部会进行指针的后移。
strsep使用如下:
 
char *str = strdup("This is a example to test the function of strsep");  
char *p = NULL;  
while(NULL != ( p = strsep(&str, " "))  
{  
    puts(p);  

而strtok使用如下:
第一次要指定待分割字串,接下来则要传NULL。
char *str = strdup("This is a example to test the function of strsep");  
char *p = NULL;  
char *tmp = str;  
while (NULL != (p = strsep(tmp, " ")))  
{  
    puts(p);  
    tmp = NULL;  
}


转载自:http://blog.csdn.net/yafeng_jiang/article/details/7109285




  函数原型:char *strtok(char *s, const char *delim);
                            char *strsep(char **s, const char *delim);
       功能:strtok和strsep两个函数的功能都是用来分解字符串为一组字符串。s为要分解的字符串,delim为分隔符字符串。
       返回值:从s开头开始的一个个子串,当没有分割的子串时返回NULL。
       相同点:两者都会改变源字符串,想要避免,可以使用strdupa(由allocate函数实现)或strdup(由malloc函数实现)。
strtok函数第一次调用时会把s字符串中所有在delim中出现的字符替换为NULL。然后通过依次调用strtok(NULL, delim)得到各部分子串。
测试代码:
[cpp] view plaincopy
#include   
#include   
  
int main(void) {  
    char s[] = "hello, world! welcome to china!";  
    char delim[] = " ,!";  
  
    char *token;  
    for(token = strtok(s, delim); token != NULL; token = strtok(NULL, delim)) {  
        printf(token);  
        printf("+");  
    }  
    printf("\n");  
    return 0;  
}  
        输出结果为:hello+world+welcome+china+


        对于strsep有如下例子:
[cpp] view plaincopy
#include   
#include   
  
int main(void) {  
    char source[] = "hello, world! welcome to china!";  
    char delim[] = " ,!";  
  
    char *s = strdup(source);  
    char *token;  
    for(token = strsep(&s, delim); token != NULL; token = strsep(&s, delim)) {  
        printf(token);  
        printf("+");  
    }  
    printf("\n");  
    return 0;  
}  
        输出结果为:hello++world++welcome+to+china++
       为什么用strtok时子串中间只有一个“+”,而strsep却有多个"+"呢?文档中有如下的解释:
One difference between strsep and strtok_r is that if the input string contains more
than one character from delimiter in a row strsep returns an empty string for each
pair of characters from delimiter. This means that a program normally should test
for strsep returning an empty string before processing it.
       大意是:如果输入的串的有连续的多个字符属于delim,(此例source中的逗号+空格,感叹号+空格等就是这种情况),strtok会返回NULL,而strsep会返回空串""。因而我们如果想用strsep函数分割字符串必须进行返回值是否是空串的判断。这也就解释了strsep的例子中有多个"+"的原因。
       我们在自己的程序中最好尽量避免使用strtok,转而使用strsep。


       下面的说明摘自于最新的Linux内核2.6.29,说明了strtok()已经不再使用,由速度更快的strsep()代替。


/** linux/lib/string.c** Copyright (C) 1991, 1992 Linus Torvalds*/  


/** stupid library routines.. The optimized versions should generally be found  


* as inline code in   


* These are buggy as well..  


* * Fri Jun 25 1999, Ingo Oeser   


* - Added strsep() which will replace strtok() soon (because strsep() is  


* reentrant and should be faster). Use only strsep() in new code, please.  


** * Sat Feb 09 2002, Jason Thomas ,  


* Matthew Hawkins   


* - Kissed strtok() goodbye
0 0
原创粉丝点击