目录

前言

一、求字符串长度的函数

1.1   ❥ strlen 

二、长度不受限制的字符串函数

2.1  ❥ strcpy 

2.1.1 strcpy的模拟实现

2.2 ❥ strcat 

2.2.1 strcat的模拟实现

2.2.2 字符串自己追加自己问题

2.3 ❥ strcmp 

2.3.1 strcmp的模拟实现

三、长度受限制的字符串函数

3.1 ❥ strncpy  

3.2 ❥ strncat 

3.3 ❥ strncmp 

四、字符串查找

4.1 ❥ strstr

4.1.1 strstr的模拟实现

4.2 ❥ strtok

五、错误信息报告

5.1 ❥ strerror

5.2  ❥ perror


前言

本节重点介绍处理字符串的库函数的使用和注意事项。

一、求字符串长度的函数

1.1   ❥ strlen 

函数原型如下:

size_t strlen ( const char * str ); 

strlen函数:求字符串长度的函数

size_t: unsigned int 即无符号整型

注意事项

  1. 字符串是以'\0'作为结束的标志,strlen返回的是字符串'\0'之前出现的字符个数(不包括'\0')
  2. strlen的使用需要包含头文件:#include <string.h>
  3. 参数指向的字符串必须以'\0'结尾

我们看下面代码:

输出">"的原因:因为strlen的返回值是一个size_t类型的,也就是无符号的整形。

可以强制转换成int,这样就会输出"<="

代码如下:

当然,也得看用什么类型的变量接收与输出

如下代码:

二、长度不受限制的字符串函数

2.1  ❥ strcpy 

 char* strcpy(char * destination, const char * source ); 

strncpy函数:字符串拷贝函数

destination:目标空间的起始地址

source:源字符串起始地址

使用strcpy函数代码如下:

这里为什么打印到good就不打印了呢,是因为把源字符串的'\0'拷贝到了目标空间。

验证:

注意事项

  1. strlen的使用需要包含头文件:#include <string.h>
  2. 源字符串必须以'\0'结尾
  3. 会把源字符串的'\0'拷贝到目标空间
  4. 目标空间必须足够大
  5. 目标空间必须可修改

易错点1

代码如下:

#include <stdio.h>
#include <string.h>
int main()
{
	char name[20] = {0};
	char arr[] = { 'a','b','c' };
	char* p=strcpy(name, arr);

	printf("%s", p);

	return 0;
}

代码运行结果如下图所示:

因为字符数组里没有'\0',所以不能拷贝。

易错点2

代码如下:

#include <stdio.h>
#include <string.h>
int main()
{
	char* p = "abcdef";
	char arr[20] = { 0 };

	char* ps = strcpy(p, arr);  //目标区域不可修改
	printf("%s", ps);

	return 0;
}

代码运行结果如下图所示:

不能这样写,程序会崩溃。这里是把数组内容拷贝到常量字符串里面去。该函数要求的目标空间必须是个变量,可变的数据才能进行更改。

2.1.1 strcpy的模拟实现

#include <stdio.h>
#include <string.h>
#include <assert.h>

char* my_strcpy(char* dest, const char* src)
{
	char* ret = dest;//保留起始地址
	assert(dest != NULL);//断言,判断是否为空
	assert(src != NULL);
	while ((*dest++ = *src++))
	{
		;
	}
	return ret;
}

int main()
{
	char arr1[20] = "abcdefg";
	char arr2[] = "good";
	char* p = my_strcpy(arr1, arr2);

	printf("%s", p);
	return 0;
}

运行结果如图下图所示:

2.2 ❥ strcat 

函数原型如下:

char* strcat(char* destination,const char* source);

strcat函数:字符串追加函数

代码如下:

注意事项

  1. 目标空间足够大,能够追加我们想要的数据(能容纳下源字符串的内容)
  2. 目标空间必须可修改
  3. 源字符串里必须有\0
  4. 目标空间也得有'\0',否则不知道从哪里追加
  5. strcat的使用需要包含头文件:#include <string.h>

2.2.1 strcat的模拟实现

#include <stdio.h>
#include <string.h>
#include <assert.h>

char* my_strcat(char* dest, const char* src)
{
	char* ret = dest;
	assert(dest != NULL);
	assert(src != NULL);
	while (*dest)
	{
		dest++;
	}
	while ((*dest++ = *src++))
	{
		;
	}
	return ret;
}

int main()
{
	char arr1[20] = "hello ";
	char arr2[] = "world";
	char* p = my_strcat(arr1, arr2);
	
	printf("%s", p);
	return 0;
}

2.2.2 字符串自己追加自己问题

字符串能否自己给自己追加呢?我们来看下面的代码:

代码1:是库函数strcat在vs2022 x64环境下运行的

代码2:是库函数在vs2022 x86环境下运行的

从上面两种运行环境可以看出,x64环境底下是可以运行出来,但x86环境底下程序会崩溃。所以尽量避免自己给自己追加。

而我们自己模拟实现的strcat函数,无论是在x64还是x86环境下程序都崩溃。(说明我们实现的字符串追加函数跟库函数strcat还是略有差异的)

代码运行结果如下:

综上所述,字符串不能自己给自己追加。原因如下:

  • 可能会造成死循环,程序崩溃
  • 可能会越界访问

2.3 ❥ strcmp 

int strcmp(const char * str1,const char * str2 );

strcmp函数:比较两个字符串是否相等的函数

strcmp代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "abcdg";
	int ret=strcmp(arr1, arr2);
	if (ret < 0)
	{
		printf("<");
	}
	else if (ret > 0)
	{
		printf(">");
	}
	else if (ret == 0)
	{
		printf("=");
	}
	return 0;
}

运行结果如下图所示:

说明比较的是该字符的ASCII值。

返回值是int的原因是:

第一个字符串<第二个字符串,则返回<0

第一个字符串=第二个字符串,则返回0

第一个字符串>第二个字符串,则返回>0

注意事项

  1. strcmp的使用需要包含头文件:#include <string.h>
  2. 比较的是字符的ASCII值。\0的ASCII最小。

补充如下图:

2.3.1 strcmp的模拟实现

#include <stdio.h>
#include <string.h>
#include <assert.h>

int my_strcmp(const char* str1, const char* str2)
{
	int ret = 0;
	assert(str1 != NULL);
	assert(str2 != NULL);
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
		{
			return 0;
		}
		str1++;
		str2++;
	}
	return *str1 - *str2;
}
int main()
{
	char arr1[]= "abcdef";
	char arr2[] = "abcdg";
	int ret = my_strcmp(arr1, arr2);

	if (ret < 0)
		printf("<");

	else if (ret > 0)
		printf(">");

	else if (ret == 0)
		printf("=");

	return 0;
}

三、长度受限制的字符串函数

3.1 ❥ strncpy  

char * strncpy ( char * destination, const char * source, size_t num ); 

strncpy函数:字符串拷贝受限制的函数。

拷贝num个字符从源字符串到目标空间。

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[] = "abcdefg";
	char arr2[] = "hello world";
	strncpy(arr1, arr2, 5);

	printf("%s", arr1);
	return 0;
}

运行结果下图所示:

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后面追加\0,直到num个。

代码如下图所示:

运行结果如下图所示:

注意'\0'的作用

代码如下:

运行结构如下图所示:

3.2 ❥ strncat 

char * strncat ( char * destination, const char * source, size_t num ); 

strncat函数:长度受限制的字符串追加函数

将source指向的字符串的前num个字符追加到destination指向的字符串末尾再追加一个'\0'字符

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[20] = "hello ";
	char arr2[] = "summer";
	strncat(arr1, arr2, 5);
	printf("%s", arr1);

	return 0;
}

运行结果如下图所示:

调试结果如下图所示:

注意:arr1后要给定数组的大小,不给定就会由于初始化了6个,追加空间不够而报错。

如果source指向的字符串的长度小于num的时候,只会将字符串中到\0的内容追加到destination指向的字符串末尾。

代码如下所示:

#include <stdio.h>
#include <string.h>
int main()
{
	char arr1[20] = "hello ";
	char arr2[] = "hh";
	strncat(arr1, arr2, 5);
	printf("%s", arr1);

	return 0;
}

soucre字符串是否给自己追加'\0'?我们来测试一下,代码如下:

#include <stdio.h>
#include <string.h>
int main()
{
	char arr1[20] = "hello\0xxxxxxxx";
	char arr2[] = "world";
	strncat(arr1, arr2, 5);
	printf("%s", arr1);

	return 0;
}

因为\0是字符串结束的标志,此处追加5个字符,world在56789的位置,如果追加上一个\0,那么[10]的位置就是\0

从上图可看出,确实source自己给自己追加了 \0 

3.3 ❥ strncmp 

int strncmp ( const char * str1, const char * str2, size_t num ); 

strncmp函数:比较两个字符串内容是否相等(长度受限制)

比较str1和str2的前num个字符,如果相等就继续往后比较,最多比较num个字母,如果提前发现不一样,就提前结束。大的字符所在的字符串大于另外一个。如果num个字符都相等,就返回0。

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "abcq";
	int ret = strncmp(arr1, arr2,4);
	printf("%d\n", ret);
	if (ret > 0)
	{
		printf(">");
	}
	else if (ret < 0)
	{
		printf("<");
	}
	else if (ret == 0)
	{
		printf("=");
	}
	return 0;
}

四、字符串查找

4.1 ❥ strstr

char * strstr ( const char * str1, const char * str2); 

strstr函数:查找子串的一个函数。

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[] = "abcdefg";
	char arr2[] = "bcd";
	char* p = strstr(arr1, arr2);
	printf("%s\n", p);
	printf("%p\n", p);
	return 0;
}

注意

  1. 看str1里面有没有出现str2这个字符串,找到返回的是子串(str2)在串(str1)的起始地址。找不到返回的是空指针NULL。(函数返回字符串str2在字符串str1中第一次出现的位置)
  2. 字符串的比较匹配不包含\0字符,以\0作为结束标志。

4.1.1 strstr的模拟实现

代码如下:

#include <stdio.h>
#include <string.h>

char* my_strstr(const char* str1, const char* str2)
{
	char* cp = (char*)str1;
	char* s1, * s2;
	if (!*str2)
		return((char*)str1);
	while (*cp)
	{
		s1 = cp;
		s2 = (char*)str2;
		while (*s1 && *s2 && !(*s1 - *s2))
			s1++, s2++;
		if (!*s2)
			return(cp);
		cp++;
	}
	return(NULL);
}

int main()
{
	char arr1[] = "abcccdefgh";
	char arr2[] = "cde";
	char* ret = my_strstr(arr1, arr2);

	if (ret == NULL)
	{
		printf("子串不存在\n");
	}
	else
	{
		printf("%s\n", ret);
	}
	return 0;
}

4.2 ❥ strtok

char * strtok ( char * str, const char * sep); 

strtok函数:切割字符串(可以把想要的串给切割出来)

第二个参数sep是个字符串,定义了当作分隔符的字符集合。

第一个参数str指定一个字符串,它包含了0个或者多个有sep字符串中一个或者多个分隔符分割的标记。

我们接下来拿这个字符串举例:tiantian@earth.com(sep为"@.")

  • strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)

  • strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。

  • strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。

如果字符串中不存在更多的标记,则返回NULL指针

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr1[20] = "tiantian@earth.com";
	const char* sep = "@.";
	char arr2[20] = { 0 };
	strcpy(arr2, arr1);

	char* ret = strtok(arr2, sep);
	printf("%s\n", ret);

	 ret = strtok(NULL, sep);
	printf("%s\n", ret);

	 ret = strtok(NULL, sep);
	printf("%s\n", ret);
	return 0;
}

运行结果如图所示:

以上是将字符串分成3次的结果,那如果继续打印,会发生什么现象呢?我们来测试一下。

从上图可以看出,当我们打印到最后还要继续打印的时候,就会显示一个空字符串,就是什么都找不到的意思,因为str已经是一个空指针了

但是我们发现,上面那种写法是有弊端的,因为不清楚有多少字段,也就不知道调用几次函数,所以我们可以这样写来完善这一点:

#include <stdio.h>
#include <string.h>
int main()
{
	char arr1[20] = "tiantian@earth.com";
	const char* sep = "@.";
	char arr2[20] = { 0 };
	strcpy(arr2, arr1);

	char* ret = NULL;
	for (strtok(arr2, sep); ret != NULL; strtok(NULL, sep))
	{
		printf("%s\n", ret);
	}
	return 0;
}

五、错误信息报告

5.1 ❥ strerror

char * strerror ( int errnum );

strerror函数:错误报告函数。(返回错误码,所对应的错误信息)

strerror函数可以把参数部分错误码所对应的错误信息的字符串地址返回来。

在不同的系统和C语言标准库的实现中都规定了一些错误码,一般是放在errno.h这个头文件中说明的,C语言程序启动时就会使用一个全局的变量errno来记录程序当前的错误码。只不过程序启动的时候errno是0,表示没有错误,当我们在使用标准库中的函数的时候发生了某种错误,就会让对应的错误码,存放在errno中。而一个错误码的数字是整数很难理解是什么意思,所以每一个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。

例如下面的代码:

5.2  ❥ perror

perror== printf+strerror

perror函数可以直接打印错误信息。打印的时候,先打印传给perror的字符串,然后打印一个冒号,紧接着打印一个空格,最后打印错误码对应的错误信息。

代码如下:

#include <stdio.h>
#include <string.h>

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("zhangsan");
		return 1;
	}
	return 0;
}

运行结果如下所示:

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐