问题标题: 酷町堂：字符串

Question

0

已解决

桑烁

高级光能

求大佬讲些基本字符串（用法之类的），顺便带上基本的例题

本人基本定义会，但不会向数组那样判断之类的

酷町豆刷题求解 C++ 1条评论 6 年，6 月前

Answer 1

已采纳

赵逸凡

初级启示者

string你竟然不会???

string内型的函数表我不说了具体就.substr .replace .erase 将a串连到b串例如123A(a串)接到b串后面只要b=b+a就行了，前提是b是string内型不是字符串数组。

字符串的输入可以是while(scanf("%s",a)==1)，读不到输入时自动跳过语句，是模拟赛的法宝（第三题）

Answer 2

王远哲

修练者

#include<string>

#include<iostream>

using namespace std;

balabala的

string a;

cin>>a;

cout<<a;

样例:

qwer

Answer 3

傅文彬

新手天翼

简介

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s="a1a2···an"(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中，字符串(string)为符号或数值的一个连续序列，如符号串(一串字符)或二进制数字串(一串二进制数字)。

通常以串的整体作为操作对象，如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等，并且各个对应位置上的字符都相等。设p、q是两个串，求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。

折叠编辑本段函数应用

1. 连接运算 concat(s1,s2,s3…sn) 相当于s1+s2+s3+…+sn.

例:concat('11','aa')='11aa';

2. 求子串。 Copy(s,I,I) 从字符串s中截取第I个字符开始后的长度为l的子串。

例:copy('abdag',2,3)='bda'

3. 删除子串。过程 Delete(s,I,l) 从字符串s中删除第I个字符开始后的长度为l的子串。

例:s:='abcde';delete(s,2,3);结果s:='ae'

4. 插入子串。过程Insert(s1,s2,I) 把s1插入到s2的第I个位置

例:s:=abc;insert('12',s,2);结果s:='a12bc'

5. 求字符串长度 length(s) 例:length('12abc')=5

在ASP中求字符串长度用 len(s)例: len("abc12")=5

6. 搜索子串的位置 pos(s1,s2) 如果s1是s2的子串，则返回s1的第一个字符在s2中的位置，若不是子串，则返回0.

例:pos('ab','12abcd')=3

7. 字符的大写转换。Upcase(ch) 求字符ch的大写体。

例:upcase('a')='A'

8. 数值转换为数串。过程 Str(x,s) 把数值x化为数串s.

例:str(12345,s); 结果s='12345'

9. 数串转换为数值。过程val(s,x,I) 把数串s转化为数值x,如果成功则I=0,不成功则I为无效字符的序数,第三个参数也可不传

例:val('1234',x,I);结果 x:=1234

折叠编辑本段病毒

"字符串(Trojan.String.a)"病毒:警惕程度★★★，木马病毒，通过网络传播，依赖系统: WIN9X/NT/2000/XP。

该病毒通过网络传播，进入用户电脑后就隐藏在系统目录和内存中，病毒发作时会给用户电脑造成以下破坏:屏幕为空、无端打开CD驱动器、进行洪水攻击、打开黄色网站等，用户要小心防毒。

折叠编辑本段形式理论

设 Σ 是叫做字母表的非空有限集合。Σ 的元素叫做"符号"或"字符"。在 Σ 上的字符串(或字)是来自 Σ 的任何有限序列。例如，如果 Σ = {0, 1}，则 0101 是在 Σ 之上的字符串。

字符串的长度是在字符串中字符的数目(序列的长度)，它可以是任何非负整数。"空串"是在 Σ 上的唯一的长度为 0 的字符串，并被指示为 ε 或 λ。

在 Σ 上的所有长度为 n 的字符串的集合指示为 Σn。例如，如果 Σ = {0, 1} 则 Σ2 = {00, 01, 10, 11}。注意 Σ0 = {ε} 对于任何字母表 Σ。

在 Σ 上的所有任何长度的字符串的集合是 Σ 的Kleene闭包并被指示为 Σ*。依据Σn, 。例如，如果 Σ = {0, 1} 则 Σ* = {ε, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, …}。尽管 Σ* 自身是可数无限的，Σ* 的所有元素都有有限长度。

在 Σ 上一个字符串的集合(就是 Σ* 的任何子集)被称为在 Σ 上的形式语言。例如，如果 Σ = {0, 1}，则带有偶数个零的字符串的集合({ε, 1, 00, 11, 001, 010, 100, 111, 0000, 0011, 0101, 0110, 1001, 1010, 1100, 1111, …})是在 Σ 上的形式语言。

折叠编辑本段串接子串

"串接"是 Σ* 上的重要二元运算。对于 Σ* 中的两个字符串 s 和 t，它们的串接被定义为在 s 中的字符序列之后跟随着 t 中的字符序列，并被指示为 st。例如，Σ = {a, b, …, z}，并且 s = bear 且 t = hug，则 st = bearhug 而 ts = hugbear。

字符串串接是结合性的，但非交换性运算。空串充当单位;对于任何字符串 s，有 εs = sε = s。所以，集合 Σ* 和串接运算形成了幺半群，就是从 Σ 生成的自由幺半群。此外，长度函数定义从 Σ* 到非负整数的幺半群同态。

字符串 s 被称为是字符串 t 的"子串"或"因子"，如果存在(可能为空)字符串 u 和 v 使得 t = usv。"是其子串"关系定义了在 Σ* 上的偏序，其最小元是空串。

折叠编辑本段词典排序

经常需要定义在字符串集合上的次序。如果字符表 Σ 有一个全序 (cf. 字母序)，则可以定义在 Σ* 上的叫做词典序的全序。注意因为 Σ 是有限的，总是可以定义在 Σ 继而在 Σ* 上的良好次序。例如，如果 Σ = {0, 1} 并且 0 < 1，则 Σ* 的词典次序是 ε < 0 < 00 < 000 < … < 011 < 0110 < … < 01111 < … < 1 < 10 < 100 < … < 101 < … < 111 …

折叠编辑本段运算

在形式理论中经常出现一些在字符串上的额外运算。它们在条目字符串运算中给出。

折叠编辑本段数据类型

字符串数据类型是建模在形式字符串的想法上的数据类型。字符串是几乎在所有编程语言中可以实现的非常重要和有用的数据类型。在某些语言中它们可作为基本类型获得，在另一些语言中做为复合类型获得。多数高级语言的语法允许通常用某种方式引用起来的字符串来表示字符串数据类型的实例;这种元字符串叫做"文本"或"字符串文本"。

折叠编辑本段长度

尽管形式字符串可以有任意(但有限)的长度，实际语言的字符串的长度经常被限制到一个人工极大值。一般的说，有两种类型的字符串数据类型: "定长字符串"，它有固定的极大长度并且不管是否达到了这个极大值都使用同样数量的内存;和"变长字符串"，它的长度不是专断固定的并且依赖于实际的大小使用可变数量的内存。在现代编程语言中的多数字符串是变长字符串。尽管叫这个名字，所有变长字符串还是在长度上有个极限，一般的说这个极限只依赖于可获得的内存的数量。

折叠编辑本段字符编码

历史上，字符串数据类型为每个字符分配一个字节，尽管精确的字符集随着区域而改变，字符编码足够类似得程序员可以忽略它 - 同一个系统在不同的区域中使用的字符集组要么让一个字符在同样位置，要么根本就没有它。这些字符集典型的基于ASCII码或EBCDIC码。

意音文本的语言比如汉语、日语和朝鲜语(合称为CJK)的合理表示需要多于256个字符(每字符一个字节编码的极限)。常规的解决涉及保持对ASCII码的单字节表示并使用双字节来表示CJK字形。现存代码在用到它们会导致一些字符串匹配和切断上的问题，严重程度依赖于字符编码是如何设计的。某些编码比如EUC家族保证在ASCII码范围内的字节值只表示ASCII字符，使得使用这些字符作为字段分隔符的系统得到编码安全。其他编码如ISO-2022和Shift-JIS不做这种担保，使得基于字节的代码做的匹配不安全。另一个问题是如果一个字符串的开头被删除了，对解码器的重要指示或关于在多字节序列中的位置的信息可能就丢失了。另一个问题是如果字符串被连接到一起(特别是在被不知道这个编码的代码截断了它们的结尾之后)，第一个字符串可能不能导致编码器进入适合处理第二个字符串的状态中。

Unicode也有些复杂的问题。多数语言有Unicode字符串数据类型(通常是UTF-16，因为它在Unicode补充位面介入之前就被增加了)。在Unicode和本地编码之间转换要求理解本地编码，这对于现存系统要一起传输各种编码的字符串而又没有实际标记出它们用了什么编码就是个问题。

折叠编辑本段实现

某些语言如 C++ 把字符串实现为可以用于任何基本类型的模版，但这是个例外而不是规则。

如果一个面向对象语言把字符串表示为对象，它们叫做"可变的"(mutable)，如果值可以在进行时间变更，叫做"不变的"(immutable)，如果这个值在建立后就冻结了。例如，Ruby 有可变字符串，而 Python 的字符串是不可变的。

其他语言，最著名的有 Prolog 和 Erlang，避免实现字符串数据类型，转而采用把字符串表示为字符代码的列表的约定。

折叠编辑本段表示法

一种常用的表示法是使用一个字符代码的数组，每个字符占用一个字节(如在ASCII代码中)或两个字节(如在unicode中)。它的长度可以使用一个结束符(一般是NUL，ASCII代码是0，在C编程语言中使用这种方法)。或者在前面加入一个整数值来表示它的长度(在Pascal语言中使用这种方法)。

这是一个用NUL结束的字符串的例子，它用10个byte存储，用ASCII表示法:

F R A N K NUL k e f w

46 52 41 4E 4B 00 6B 66 66 77

上面的字符串的长度为5个字符，但注意它占用6个字节。结束符后的字符没有任何意义。

这是相同的Pascal字符串:

length F R A N K k e f w

05 46 52 41 4E 4B 6B 66 66 77

当然，可能还有其它的表示法。使用树和列表可以使得一些字符串操作(如插入和删除)更高效。

折叠编辑本段实用程序

一些编程语言设计为编写字符串处理程序更容易编写。这是一些例子:

awk

Icon

perl

MUMPS

sed

SNOBOL

很多UNIX实用程序进行简单的字符串处理，并能用于简单地编写一些强大的字符串处理算法。文件和有限流可以像字符串一样查看。

一些新的编程语言，包括Perl、Python和Ruby，借助正则表达式来帮助文本处理。

折叠编辑本段操作

一个简单的字符串操作是"连接":也就是说先写一个字符串S，随后在后面再写一个T得到ST这样一个过程。其它的常见操作包括在一个长字符串中搜索一个子串，排列一组字符串以及分析一个字符串。因为存在如此多的字符串应用方式，所以相应地有许多权衡了不同应用的相关算法。高级的字符串算法通常使用包括后向树和有限状态机在内的复杂机制和数据结构。

折叠编辑本段算法

这是一些字符串处理算法，在字符串上进行不同的处理:

字符串查找算法

正则表达式算法

模式匹配

字符串的匹配算法(kmp)

AC自动机

后缀数组/树/自动机

折叠编辑本段PHP中介绍

string是一系列字符。在 php 中，字符和字节一样，也就是说，一共有 256 种不同字符的可能性。这也暗示 php 对 Unicode 没有本地支持。请参阅函数utf8_encode()和utf8_decode()以了解有关 Unicode 支持

注:一个字符串变得非常巨大也没有问题，php 没有给字符串的大小强加实现范围，所以完全没有理由担心长字符串。

语法

字符串可以用三种字面上的方法定义。

单引号

双引号

定界符

折叠单引号

指定一个简单字符串的最简单的方法是用单引号(字符 ')括起来。

要表示一个单引号，需要用反斜线(/)转义，和很多其它语言一样。如果在单引号之前或字符串结尾需要出现一个反斜线，需要用两个反斜线表示。注意如果试图转义任何其它字符，反斜线本身也会被显示出来!所以通常不需要转义反斜线本身。

注:在 php 3 中，此情况下将发出一个 E_NOTICE 级的警告。

注:和其他两种语法不同，单引号字符串中出现的变量和转义序列不会被变量的值替代。

<?phpecho 'this is a simple string';echo 'You can also have embedded newlines instrings this way as it isokay to do';// Outputs: Arnold once said: "I'll be back"echo 'Arnold once said: "I/'ll be back"';// Outputs: You deleted C:/*.*?echo 'You deleted C://*.*?';// Outputs: You deleted C:/*.*?echo 'You deleted C:/*.*?';// Outputs: This will not expand: /n a newlineecho 'This will not expand: /n a newline';// Outputs: Variables do not $expand $eitherecho 'Variables do not $expand $either';?>

此外，如果试图转义任何其它字符，反斜线本身也会被显示出来!

双引号字符串最重要的一点是其中的变量名会被变量值替代。细节参见字符串解析。

折叠定界符

另一种给字符串定界的方法使用定界符语法("<<<")。应该在 <<< 之后提供一个标识符，然后是字符串，然后是同样的标识符结束字符串。

结束标识符必须从行的第一列开始。同样，标识符也必须遵循 php 中其它任何标签的命名规则:只能包含字母数字下划线，而且必须以下划线或非数字字符开始。

例子 11-3. 非法的例子

<?phpclass foo { public $bar = <<<EOTbarEOT;}?>

定界符文本表现的就和双引号字符串一样，只是没有双引号。这意味着在定界符文本中不需要转义引号，不过仍然可以用以上列出来的转义代码。变量会被展开，但当在定界符文本中表达复杂变量时和字符串一样同样也要注意。

例子 11-4. 定界符字符串例子

<?php$str = <<<EODExample of stringspanning multiple linesusing heredoc syntax.EOD;/* More complex example, with variables. */class foo{ var $foo; var $bar; function foo() { $this->foo = 'Foo'; $this->bar = array('Bar1', 'Bar2', 'Bar3'); }}$foo = new foo();$name = 'MyName';echo <<<EOTMy name is "$name". I am printing some $foo->foo.Now, I am printing some {$foo->bar[1]}.This should print a capital 'A': /x41EOT;?>注:定界符支持是 php 4 中加入的。

折叠变量解析

当用双引号或者定界符指定字符串时，其中的变量会被解析。

有两种语法，一种简单的和一种复杂的。简单语法最通用和方便，它提供了解析变量，数组值，或者对象属性的方法。

复杂语法是 php 4 引进的，可以用花括号括起一个表达式。

简单语法如果遇到美元符号($)，解析器会尽可能多地取得后面的字符以组成一个合法的变量名。如果想明示指定名字的结束，用花括号把变量名括起来。

<?php$beer = 'Heineken';echo "$beer's taste is great"; // works, "'" is an invalid character for varnamesecho "He drank some $beers"; // won't work, 's' is a valid character for varnamesecho "He drank some ${beer}s"; // worksecho "He drank some {$beer}s"; // works?>

同样也可以解析数组索引或者对象属性。对于数组索引，右方括号(])标志着索引的结束。对象属性则和简单变量适用同样的规则，尽管对于对象属性没有像变量那样的小技巧。

<?php// These examples are specific to using arrays inside of strings.// When outside of a string, always quote your array string keys// and do not use {braces} when outside of strings either.// Let's show all errorserror_reporting(E_ALL);$fruits = array('strawberry' => 'red', 'banana' => 'yellow');// Works but note that this works differently outside string-quotesecho "A banana is $fruits[banana].";// Worksecho "A banana is {$fruits['banana']}.";// Works but php looks for a constant named banana first// as described below.echo "A banana is {$fruits[banana]}.";// Won't work, use braces. This results in a parse error.echo "A banana is $fruits['banana'].";// Worksecho "A banana is " . $fruits['banana'] . ".";// Worksecho "This square is $square->width meters broad.";// Won't work. For a solution, see the complex syntax.echo "This square is $square->width00 centimeters broad.";?>

对于任何更复杂的情况，应该使用复杂语法。

复杂(花括号)语法不是因为语法复杂而称其为复杂，而是因为用此方法可以包含复杂的表达式。

事实上，用此语法可以在字符串中包含任何在名字空间的值。仅仅用和在字符串之外同样的方法写一个表达式，然后用 { 和 } 把它包含进来。因为不能转义"{"，此语法仅在 $ 紧跟在 { 后面时被识别(用"{/$"或者"/{$"来得到一个字面上的"{$")。用一些例子可以更清晰:

<?php// Let's show all errorserror_reporting(E_ALL);$great = 'fantastic';// 不行，输出为:This is { fantastic}echo "This is { $great}";// 可以，输出为:This is fantasticecho "This is {$great}";echo "This is ${great}";// Worksecho "This square is {$square->width}00 centimeters broad.";// Worksecho "This works: {$arr[4][3]}";// This is wrong for the same reason as $foo[bar] is wrong// outside a string. In otherwords, it will still work but// because php first looks for a constant named foo, it will// throw an error of level E_NOTICE (undefined constant).echo "This is wrong: {$arr[foo][3]}";// Works. When using multi-dimensional arrays, always use// braces around arrays when inside of stringsecho "This works: {$arr['foo'][3]}";// Works.echo "This works: " . $arr['foo'][3];echo "You can even write {$obj->values[3]->name}";echo "This is the value of the var named $name: {${$name}}";?>

访问和修改字符串中的字符

字符串中的字符可以通过在字符串之后用花括号指定所要字符从零开始的偏移量来访问和修改。

注:为了向下兼容，仍然可以用方括号。不过此语法自 php 4 起已过时。

例子 11-5. 一些字符串例子

<?php// Get the first character of a string$str = 'This is a test.';$first = $str{0};// Get the third character of a string$third = $str{2};// Get the last character of a string.$str = 'This is still a test.';$last = $str{strlen($str)-1};// Modify the last character of a string$str = 'Look at the sea';$str{strlen($str)-1} = 'e';?>

折叠实用函数

字符串可以用"."(点)运算符连接。注意这里不能用"+"(加)运算符。更多信息参见字符串运算符。

有很多实用函数来改变字符串。

普通函数见字符串函数一节，高级搜索和替换见正则表达式函数(两种风格:Perl 和 POSIX 扩展)。

还有 URL 字符串函数，以及加密/解密字符串的函数(mcrypt 和 mhash)。

最后，如果还是找不到想要的函数，参见字符类型函数。

折叠转换

可以用 (string) 标记或者strval()函数将一个值转换为字符串。当某表达式需要字符串时，字符串的转换会在表达式范围内自动完成。例如当使用echo()或者print()函数时，或者将一个变量值与一个字符串进行比较的时候。阅读手册中有关类型和类型戏法中的部分有助于更清楚一些。参见settype()。

布尔值TRUE将被转换为字符串 "1"，而值FALSE将被表示为 ""(即空字符串)。这样就可以随意地在布尔值和字符串之间进行比较。

整数或浮点数数值在转换成字符串时，字符串由表示这些数值的数字字符组成(浮点数还包含有指数部分)。

数组将被转换成字符串 "Array"，因此无法通过echo()或者print()函数来输出数组的内容。请参考下文以获取更多提示。

对象将被转换成字符串 "Object"。如果因为调试需要，需要将对象的成员变量打印出来，请阅读下文。如果希望得到该对象所依附的类的名称，请使用函数get_class()。自 php 5 起，如果合适可以用 __toString() 方法。

资源类型总是以 "Resource id #1" 的格式被转换成字符串，其中 1 是 php 在运行时给资源指定的唯一标识。如果希望获取资源的类型，请使用函数get_resource_type()。

NULL将被转换成空字符串。

正如以上所示，将数组、对象或者资源打印出来，并不能提供任何关于这些值本身的有用的信息。请参阅函数print_r()和var_dump()，对于调试来说，这些是更好的打印值的方法。

可以将 php 的值转换为字符串以永久地储存它们。这种方法被称为序列化，可以用函数serialize()来完成该操作。如果在安装 php 时建立了 WDDX 支持，还可以将 php 的值序列化为 XML 结构。

折叠转换数值

当一个字符串被当作数字来求值时，根据以下规则来决定结果的类型和值。

如果包括"."，"e"或"E"其中任何一个字符的话，字符串被当作float来求值。否则就被当作整数。

该值由字符串最前面的部分决定。如果字符串以合法的数字数据开始，就用该数字作为其值，否则其值为 0(零)。合法数字数据由可选的正负号开始，后面跟着一个或多个数字(可选地包括十进制分数)，后面跟着可选的指数。指数是一个"e"或者"E"后面跟着一个或多个数字。

<?php$foo = 1 + "10.5"; // $foo is float (11.5)$foo = 1 + "-1.3e3"; // $foo is float (-1299)$foo = 1 + "bob-1.3e3"; // $foo is integer (1)$foo = 1 + "bob3"; // $foo is integer (1)$foo = 1 + "10 Small Pigs"; // $foo is integer (11)$foo = 4 + "10.2 Little Piggies"; // $foo is float (14.2)$foo = "10.0 pigs " + 1; // $foo is float (11)$foo = "10.0 pigs " + 1.0; // $foo is float (11)?>

此转换的更多信息见 Unix 手册中关于 strtod(3) 的部分。

如果想测试本节中的任何例子，可以拷贝和粘贴这些例子并且加上下面这一行自己看看会发生什么:

<?phpecho "/$foo==$foo; type is " . gettype ($foo) . "<br />/n";?>

不要指望在将一个字符转换成整型时能够得到该字符的编码(可能也会在 C 中这么做)。如果希望在字符编码和字符之间转换，请使用ord()和chr()函数。

Answer 4

钱帅文

中级天翼

1

Answer 5

陈天宇

资深守护

之所以抛弃char*的字符串而选用C++标准程序库中的string类，是因为他和前者比较起来，不必
担心内存是否足够、字符串长度等等，而且作为一个类出现，他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作，==
进行比较，+ 做串联（是不是很简单?）。我们尽可以把它看成是C++的基本数据类型。

首先，为了在我们的程序中使用string类型，我们必须包含头文件 <string>。如下：
#include <string> //注意这里不是string.h string.h是C字符串头文件

1．声明一个C++字符串
声明一个字符串变量很简单：
string Str;
这样我们就声明了一个字符串变量，但既然是一个类，就有构造函数和析构函数。上面的声明没有传入参数，所以就直接使用了string的默认的构造函数，这个函数所作的就是把Str初始化为一个空字符串。String类的构造函数和析构函数如下：

a) string s; //生成一个空字符串s
b) string s(str) //拷贝构造函数生成str的复制品
c) string s(str,stridx) //将字符串str内"始于位置stridx"的部分当作字符串的初值
d) string s(str,stridx,strlen) //将字符串str内"始于stridx且长度顶多strlen"的部分作为字符串的初值
e) string s(cstr) //将C字符串作为s的初值
f) string s(chars,chars_len) //将C字符串前chars_len个字符作为字符串s的初值。
g) string s(num,c) //生成一个字符串，包含num个c字符
h) string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值
i) s.~string() //销毁所有字符，释放内存
都很简单，我就不解释了。

2．字符串操作函数
这里是C++字符串的重点，我先把各种操作函数罗列出来，不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数，再到后面看他的详细解释。
a) =,assign() //赋以新值
b) swap() //交换两个字符串的内容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare() //比较字符串
j) size(),length() //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty() //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) >>,getline() //从stream读取某值
q) << //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
下面详细介绍：

2．1 C++字符串和C字符串的转换
C
++提供的由C++字符串得到对应的C_string的方法是使用data()、c_str()和copy()，其中，data()以字符数组的形式返回字符串内容，但并不添加’\0’。c_str()返回一个以‘\0’结尾的字符数组，而copy()则把字符串的内容复制或写入既有的c_string或
字符数组内。C++字符串并不以’\0’结尾。我的建议是在程序中能使用C++字符串就使用，除非万不得已不选用c_string。由于只是简单介绍，详细介绍掠过，谁想进一步了解使用中的注意事项可以给我留言(到我的收件箱)。我详细解释。

Answer 6

王子健

初级天翼

我是百度狂

哈哈

c++中string的用法

之所以抛弃char*的字符串而选用C++标准程序库中的string类，是因为他和前者比较起来，不必
担心内存是否足够、字符串长度等等，而且作为一个类出现，他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作，==
进行比较，+ 做串联（是不是很简单?）。我们尽可以把它看成是C++的基本数据类型。

首先，为了在我们的程序中使用string类型，我们必须包含头文件 <string>。如下：
#include <string> //注意这里不是string.h string.h是C字符串头文件

1．声明一个C++字符串
声明一个字符串变量很简单：
string Str;
这样我们就声明了一个字符串变量，但既然是一个类，就有构造函数和析构函数。上面的声明没有传入参数，所以就直接使用了string的默认的构造函数，这个函数所作的就是把Str初始化为一个空字符串。String类的构造函数和析构函数如下：

a) string s; //生成一个空字符串s
b) string s(str) //拷贝构造函数生成str的复制品
c) string s(str,stridx) //将字符串str内"始于位置stridx"的部分当作字符串的初值
d) string s(str,stridx,strlen) //将字符串str内"始于stridx且长度顶多strlen"的部分作为字符串的初值
e) string s(cstr) //将C字符串作为s的初值
f) string s(chars,chars_len) //将C字符串前chars_len个字符作为字符串s的初值。
g) string s(num,c) //生成一个字符串，包含num个c字符
h) string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值
i) s.~string() //销毁所有字符，释放内存
都很简单，我就不解释了。

2．字符串操作函数
这里是C++字符串的重点，我先把各种操作函数罗列出来，不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数，再到后面看他的详细解释。
a) =,assign() //赋以新值
b) swap() //交换两个字符串的内容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare() //比较字符串
j) size(),length() //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty() //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) >>,getline() //从stream读取某值
q) << //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
下面详细介绍：

2．1 C++字符串和C字符串的转换
C
++提供的由C++字符串得到对应的C_string的方法是使用data()、c_str()和copy()，其中，data()以字符数组的形式返回字符串内容，但并不添加’\0’。c_str()返回一个以‘\0’结尾的字符数组，而copy()则把字符串的内容复制或写入既有的c_string或
字符数组内。C++字符串并不以’\0’结尾。我的建议是在程序中能使用C++字符串就使用，除非万不得已不选用c_string。由于只是简单介绍，详细介绍掠过，谁想进一步了解使用中的注意事项可以给我留言(到我的收件箱)。我详细解释。

2．2 大小和容量函数
一个C++字符串存在三种大小：a)现有的字符数，函数是size()和length()，他们等效。Empty()用来检查字符串是否为空。b)max_size()
这个大小是指当前C++字符串最多能包含的字符数，很可能和机器本身的限制或者字符串所在位置连续内存的大小有关系。我们一般情况下不用关心他，应该大小足够我们用的。但是不够用的话，会抛出length_error异常c)capacity()重新分配内存之前
string所能包含的最大字符数。这里另一个需要指出的是reserve()函数，这个函数为string重新分配内存。重新分配的大小由其参数决定，
默认参数为0，这时候会对string进行非强制性缩减。

还有必要再重复一下C++字符串和C字符串转换的问
题，许多人会遇到这样的问题，自己做的程序要调用别人的函数、类什么的（比如数据库连接函数Connect(char*,char*)），但别人的函数参
数用的是char*形式的，而我们知道，c_str()、data()返回的字符数组由该字符串拥有，所以是一种const
char*,要想作为上面提及的函数的参数，还必须拷贝到一个char*,而我们的原则是能不使用C字符串就不使用。那么，这时候我们的处理方式是：如果
此函数对参数(也就是char*)的内容不修改的话，我们可以这样Connect((char*)UserID.c_str(),
(char*)PassWD.c_str()),但是这时候是存在危险的，因为这样转换后的字符串其实是可以修改的（有兴趣地可以自己试一试），所以我强调除非函数调用的时候不对参数进行修改，否则必须拷贝到一个char*上去。当然，更稳妥的办法是无论什么情况都拷贝到一个char*上去。同时我们也祈
祷现在仍然使用C字符串进行编程的高手们（说他们是高手一点儿也不为过，也许在我们还穿开裆裤的时候他们就开始编程了，哈哈…）写的函数都比较规范，那样
我们就不必进行强制转换了。
2．3元素存取

我们可以使用下标操作符[]和函数at()对元素包含的字符进行访问。但是应该注意的是操作符[]并不检查索引是否有效（有效索引0~str.length()），如果索引失效，会引起未定义的行为。而at()会检查，如果使用
at()的时候索引无效，会抛出out_of_range异常。
有一个例外不得不说，const string
a;的操作符[]对索引值是a.length()仍然有效，其返回值是’\0’。其他的各种情况，a.length()索引都是无效的。举例如下：
const string Cstr("const string");
string Str("string");

Str[3]; //ok
Str.at(3); //ok

Str[100]; //未定义的行为
Str.at(100); //throw out_of_range

Str[Str.length()] //未定义行为
Cstr[Cstr.length()] //返回 ‘\0’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) ////throw out_of_range

我不赞成类似于下面的引用或指针赋值：
char& r=s[2];
char* p= &s[3];
因为一旦发生重新分配，r,p立即失效。避免的方法就是不使用。

2．4比较函数
C ++字符串支持常见的比较操作符（>,>=,<,<=,==,!=），甚至支持string与C-string的比较(如
str<"hello")。在使用>,>=,<,<=这些操作符的时候是根据"当前字符特性"将字符按字典顺序进行逐一得
比较。字典排序靠前的字符小，比较的顺序是从前向后比较，遇到不相等的字符就按这个位置上的两个字符的比较结果确定两个字符串的大小。同时，string
("aaaa") <string(aaaaa)。
另一个功能强大的比较函数是成员函数compare()。他支持多参数处理，支持用索引值和长度定位子串来进行比较。他返回一个整数来表示比较结果，返回值意义如下：0-相等
〉0-大于 <0-小于。举例如下：
string s("abcd");

s.compare("abcd"); //返回0
s.compare("dcba"); //返回一个小于0的值
s.compare("ab"); //返回大于0的值

s.compare(s); //相等
s.compare(0,2,s,2,2); //用"ab"和"cd"进行比较小于零
s.compare(1,2,"bcx",2); //用"bc"和"bc"比较。
怎么样？功能够全的吧！什么？还不能满足你的胃口？好吧，那等着，后面有更个性化的比较算法。先给个提示，使用的是STL的比较算法。什么？对STL一窍不通？靠，你重修吧！

2．5 更改内容
这在字符串的操作中占了很大一部分。

首先讲赋值，第一个赋值方法当然是使用操作符=，新值可以是string(如：s=ns)
、c_string(如：s="gaint")甚至单一字符（如：s=’j’）。还可以使用成员函数assign()，这个成员函数可以使你更灵活的对字符串赋值。还是举例说明吧：

s.assign(str); //不说
s.assign(str,1,3);//如果str是"iamangel" 就是把"ama"赋给字符串
s.assign(str,2,string::npos);//把字符串str从索引值2开始到结尾赋给s
s.assign("gaint"); //不说
s.assign("nico",5);//把’n’ ‘I’ ‘c’ ‘o’ ‘\0’赋给字符串
s.assign(5,’x’);//把五个x赋给字符串
把字符串清空的方法有三个：s="";s.clear();s.erase();(我越来越觉得举例比说话让别人容易懂！)。
string提供了很多函数用于插入（insert）、删除（erase）、替换（replace）、增加字符。
先说增加字符（这里说的增加是在尾巴上），函数有 +=、append()、push_back()。举例如下：
s+=str;//加个字符串
s+="my name is jiayp";//加个C字符串
s+=’a’;//加个字符

s.append(str);
s.append(str,1,3);//不解释了同前面的函数参数assign的解释
s.append(str,2,string::npos)//不解释了

s.append("my name is jiayp");
s.append("nico",5);
s.append(5,’x’);

s.push_back(‘a’);//这个函数只能增加单个字符对STL熟悉的理解起来很简单

也许你需要在string中间的某个位置插入字符串，这时候你可以用insert()函数，这个函数需要你指定一个安插位置的索引，被插入的字符串将放在这个索引的后面。

s.insert(0,"my name");
s.insert(1,str);
这种形式的insert()函数不支持传入单个字符，这时的单个字符必须写成字符串形式(让人恶心)。既然你觉得恶心，那就不得不继续读下面一段话：为了插
入单个字符，insert()函数提供了两个对插入单个字符操作的重载函数：insert(size_type index,size_type num,chart
c)和insert(iterator pos,size_type num,chart
c)。其中size_type是无符号整数，iterator是char*,所以，你这么调用insert函数是不行的：insert(0,1,
’j’);这时候第一个参数将转换成哪一个呢？所以你必须这么写：insert((string::size_type)0,1,’j’)！第二种形式指
出了使用迭代器安插字符的形式，在后面会提及。顺便提一下，string有很多操作是使用STL的迭代器的，他也尽量做得和STL靠近。
删除函数erase()的形式也有好几种（真烦！），替换函数replace()也有好几个。举例吧：
string s="il8n";
s.replace(1,2,"nternationalizatio");//从索引1开始的2个替换成后面的C_string
s.erase(13);//从索引13开始往后全删除
s.erase(7,5);//从索引7开始往后删5个

2．6提取子串和字符串连接
题取子串的函数是：substr(),形式如下：
s.substr();//返回s的全部内容
s.substr(11);//从索引11往后的子串
s.substr(5,6);//从索引5开始6个字符
把两个字符串结合起来的函数是+。（谁不明白请致电120）

2．7输入输出操作
1．>> 从输入流读取一个string。
2．<< 把一个string写入输出流。
另一个函数就是getline(),他从输入流读取一行内容，直到遇到分行符或到了文件尾。

2．8搜索与查找
查找函数很多，功能也很强大，包括了：
find()
rfind()
find_first_of()
find_last_of()
find_first_not_of()
find_last_not_of()
这些函数返回符合搜索条件的字符区间内的第一个字符的索引，没找到目标就返回npos。所有的函数的参数说明如下：
第一个参数是被搜寻的对象。第二个参数（可有可无）指出string内的搜寻起点索引，第三个参数（可有可无）指出搜寻的字符个数。比较简单，不多说不理解的可以向我提出，我再仔细的解答。当然，更加强大的STL搜寻在后面会有提及。

最
后再说说npos的含义，string::npos的类型是string::size_type,所以，一旦需要把一个索引与npos相比，这个索引值必须是string::size)type类型的，更多的情况下，我们可以直接把函数和npos进行比较（如：if(s.find("jia")==
string::npos)）。

主要基础例题有

1079 统计大小写个数
2653    字符串读入2
2654    可爱的酷町喵
2230    字符数组逆向输出
2796    字符串连接1
......






提高一点的有:
    1463    山重水复
    1094    字符串的包含问题
    2789    加强版字符游戏
    2867    字符串解压2
    1080    找出首个不重复字符





难一点的有:
    1773    表达式求值
    1191    括号配对
    1373    单词查找
    1469    回文单词句式
    2852    字符串擦除字符并压缩

问题标题: 酷町堂：字符串

6 个回答: