在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
今天装了10.10。马上就可以实际编写swift了。还是很兴奋啊。 哈哈。字符串和字符是大家最容易打交道的。今天就转一下讲解swift中字符串和字符的文章。希望对大家有帮助。
原文地址:http://www.cocoachina.com/newbie/basic/2014/0606/8704.html
Swift系列文章由CocoaChina翻译小组翻译自苹果的官方文档:The Swift Programming Language--Language Guide--Strings and Characters。本篇译者:wh1100717(Github主页),敬请勘误,欢迎在 CocoaChina github主页 查看更多文章!
String 是一个有序的字符集合,例如 "hello, world", "albatross"。Swift 字符串通过 String 类型来表示,也可以表示为 Character 类型值的集合。
Swift 的 String 和 Character 类型提供了一个快速的,兼容 Unicode 的方式来处理代码中的文本信息。创建和操作字符串的语法与 C的操作方式相似,轻量并且易读。字符串连接操作只需要简单地通过 + 号将两个字符串相连即可。与 Swift 中其他值一样,能否更改字符串的值,取决于其被定义为常量还是变量。
尽管语法简易,但 String 类型是一种快速、现代化的字符串实现。每一个字符串都是由独立编码的 Unicode 字符组成,并提供了用于访问这些字符在不同Unicode表示的支持。
String也可以用来在长字符串中插入常量、变量、字面量和表达式,这一过程称为字符串插值。这使得创建用于展示、存储和打印的自定义字符串变得轻松自如。
更多关于在 Foundation 和 Cocoa 中使用 String 的信息请查看 Using Swift with Cocoa and Objective-C。
字符串字面量
您可以在您的代码中包含一段预定义的字符串值作为字符串字面量。字符串字面量是由双引号包裹着的具有固定顺序的文本字符。
字符串字面量可以用于为常量和变量提供初始值。
字符串字面量可以包含以下特殊字符:
1.转义特殊字符 \0 (空字符)、\\(反斜线)、\t (水平制表符)、\n (换行符)、\r (回车符)、\" (双引号)、\' (单引号)。
2.单字节 Unicode 标量,写成 \xnn,其中 nn 为两位十六进制数。
3.双字节 Unicode 标量,写成 \unnnn,其中 nnnn 为四位十六进制数。
4.四字节 Unicode 标量,写成 \Unnnnnnnn,其中 nnnnnnnn 为八位十六进制数。
下面的代码为各种特殊字符的使用示例。
wiseWords 常量包含了两个转移特殊字符 (双括号);dollarSign、blackHeart 和 sparklingHeart 常量演示了三种不同格式的 Unicode 标量:
初始化空字符串
为了构造一个很长的字符串,可以创建一个空字符串作为初始值。可以将空的字符串字面量赋值给变量,也可以初始化一个新的 String 实例:
您可以通过检查其 Boolean 类型的 isEmpty 属性来判断该字符串是否为空:
字符串可变性
您可以通过将一个特定字符串分配给一个变量(对其进行修改)或者常量(保证其不会被修改)来指定该字符串是否可以被修改:
字符串是值类型
Swift 的 String 类型是值类型。如果您创建了一个新的字符串值,那么当其进行常量、变量赋值操作或在函数/方法中传递时,会进行值拷贝。在不同情况下,都会对已有字符串值创建新副本,并对该新副本进行传递或赋值。值类型在 Structures and Enumerations Are Value Types 中进行了说明。
Swift 默认字符串拷贝的方式保证了在函数/方法中传递的是字符串的值,其明确您独有该字符串的值,无论它来自哪里。您可以放心您传递的字符串本身不会被更改,除非是你自己更改它。
在实际编译时,Swift编译器会优化字符串的使用,使实际的复制只发生在绝对必要的情况下,这意味着您始终可以将字符串作为值类型的同时获得极高的性能。
使用字符(Characters)
Swift 的 String 类型表示特定序列的字符值的集合。每一个字符值代表一个 Unicode 字符。您可利用 for-in 循环来遍历字符串中的每一个字符:
for-in 循环在For Loops中进行了详细描述。
另外,通过标明一个 Character 类型注解并通过字符字面量进行赋值,可以建立一个独立的字符常量或变量:
计算字符数量
通过调用全局 countElements 函数,并将字符串作为参数进行传递可以获取该字符串的字符数量。
连接字符串和字符
字符串和字符的值可以通过加法运算符 (+) 相加在一起并创建一个新的字符串值:
您也可以通过加法赋值运算符 (+=) 将一个字符串或者字符添加到一个已经存在字符串变量上:
字符串插值
字符串插值是一种全新的构建字符串的方式,可以在其中包含常量、变量、字面量和表达式。您插入的字符串字面量的每一项都被包裹在以反斜线为前缀的圆括号中:
在上面的例子中,multiplier 作为 \(multiplier) 被插入到一个字符串字面量中。当创建字符串执行插值计算时此占位符会被替换为 multiplier 实际的值。
multiplier 的值也作为字符串中后面表达式的一部分。该表达式计算 Double(multiplier) * 2.5 的值并将结果 (7.5) 插入到字符串中。在这个例子中,表达式写为 \(Double(multiplier) * 2.5) 并包含在字符串字面量中。
比较字符串
Swift 提供了三种方式来比较字符串的值:字符串相等,前缀相等和后缀相等。
字符串相等
如果两个字符串以同一顺序包含完全相同的字符,则认为两者字符串相等:
前缀/后缀相等
通过调用字符串的 hasPrefix/hasSuffix 方法来检查字符串是否拥有特定前缀/后缀。两个方法均需要以字符串作为参数传入并返回 Boolean 值。两个方法均执行基本字符串和前缀/后缀字符串之间逐个字符的比较操作。
下面的例子以一个字符串数组表示莎士比亚话剧《罗密欧与朱丽叶》中前两场的场景位置:
您可以利用 hasPrefix 方法使用romeoAndJuliet数组来计算话剧中第一幕的场景数:
同样,可使用hasSuffix方法来计算发生在Capulet公馆和Lawrence牢房内以及周围的场景数。
大写和小写字符串
您可以通过字符串的 uppercaseString 和 lowercaseString 属性来访问一个字符串的大写/小写版本。
Unicode
Unicode 是文本编码和表示的国际标准。它使您可以用标准格式表示来自任意语言几乎所有的字符,并能够对文本文件或网页这样的外部资源中的字符进行读写操作。
Swift 的字符串和字符类型是完全兼容 Unicode 的,它支持如下所述的一系列不同的 Unicode 编码。
Unicode 术语(Terminology)
Unicode 中每一个字符都可以被解释为一个或多个 unicode 标量。一个unicode 标量是字符或者修饰符的唯一21位数(和名称),例如 U+0061 表示小写的拉丁字母A ("a"),U+1F425 表示正面站立的鸡宝宝 ("????")
当 Unicode 字符串被写进文本文件或其他存储结构当中,这些 unicode 标量将会按照 Unicode 定义的集中格式之一进行编码。每个格式将字符串编码为小的代码块-code units,其包括UTF-8格式(以8位代码单元进行编码)和UTF-16格式(以16位代码单元进行编码)。
字符串的 Unicode 表示
Swift 提供了几种不同的方式来访问字符串的 Unicode 表示。
您可以利用 for-in 来对字符串进行遍历,从而以 Unicode 字符的方式访问每一个字符值。该过程在 Working with Characters 中进行了描述。
另外,能够以其他三种 Unicode 兼容的方式访问字符串的值:
1.UTF-8 代码单元集合 (利用字符串的 utf8 属性进行访问)
2.UTF-16 代码单元集合 (利用字符串的 utf16 属性进行访问)
3.21位的 Unicode 标量值集合 (利用字符串的 unicodeScalars 属性进行访问)
下面由 D,o,g ! 和字符(DOG FACE,Unicode 标量为 U+1F436)组成的字符串中的每一个字符代表着一种不同的表示:
UTF-8
您可以通过遍历字符串的 utf8 属性来访问它的 UTF-8 表示。其为 UTF8View 类型的属性,UTF8View 是无符号8位 (UInt8) 值的集合,每一个 UIn8 都是一个字符的 UTF-8 表示:
上面的例子中,前四个10进制codeUnit值 (68, 111, 103, 33) 代表了字符 D o g 和 ! ,他们的 UTF-8 表示与其ASCII 表示相同。后四个codeUnit值 (240, 159, 144, 182) 是DOG FACE字符的4位UTF-8表示。
UTF-16
您可以通过遍历字符串的 utf16 属性来访问它的 UTF-16 表示。其为 UTF16View 类型的属性,是UTF16View 是无符号16位 (UInt16) 值的集合,每一个 UInt16 都是一个字符的 UTF-16 表示:
同样,前四个codeUnit值 (68, 111, 103, 33) 代表了字符 D o g 和 ! ,他们的 UTF-16 code units值和 UTF-8 表示完全相同。
第五和第六个codeUnit值 (55357 and 56374) 是 DOG FACE字符的UTF-16 表示。第一个值为 U+D83D (十进制值为 55357),第二个值为 U+DC36 (十进制值为 56374)。
Unicode 标量 (Unicode Scalars)
您可以通过遍历字符串的 unicodeScalars 属性来访问它的 Unicode 标量表示。其为 UnicodeScalarView 类型的属性, UnicodeScalarView 是 UnicodeScalar 的集合。一个Unicode Scalar是任意的21位的 Unicode 代码点。
每一个 UnicodeScalar 拥有一个值属性,可以返回对应的21位数值,用 UInt32值来表示。
同样,前四个UnicodeScalar值 (68, 111, 103, 33) 再次代表了字符D, o, g和 ! 。第五个也是最后一个UnicodeScalar的值属性为128054,是一个十六进制1F436的十进制表示。其等同于DOG FACE 字符的Unicode 标量 U+1F436。
作为查询字符值属性的一种替代方法,每个 UnicodeScalar 值也可以用来构建一个新的字符串值,比如在字符串插值中使用:
本章由CocoaChina的翻译小组成员 wh1100717(Github主页)翻译,转载请注明出处和译者信息,拒绝商业之用。
|
请发表评论