Strings

Core.AbstractString — Type

AbstractString型は、Juliaにおけるすべての文字列実装のスーパークラスです。文字列は、AbstractChar型によって表されるUnicodeコードポイントのシーケンスのエンコーディングです。Juliaは文字列に関していくつかの仮定をしています：

文字列は固定サイズの「コードユニット」に基づいてエンコードされています。
- コードユニットはcodeunit(s, i)で抽出できます。
- 最初のコードユニットのインデックスは1です。
- 最後のコードユニットのインデックスはncodeunits(s)です。
- 1 ≤ i ≤ ncodeunits(s)を満たす任意のインデックスiは有効です。
文字列のインデックスはこれらのコードユニットに基づいて行われます：
- 文字は有効な文字列インデックスiを使ってs[i]で抽出されます。
- 文字列内の各AbstractCharは1つ以上のコードユニットでエンコードされています。
- AbstractCharの最初のコードユニットのインデックスのみが有効なインデックスです。
- AbstractCharのエンコーディングは、その前後に何があるかに依存しません。
- 文字列のエンコーディングは自己同期しており、すなわちisvalid(s, i)はO(1)です。

コードユニット、文字、または部分文字列を文字列から抽出するいくつかの文字列関数は、範囲外または無効な文字列インデックスを渡すとエラーになります。これにはcodeunit(s, i)やs[i]が含まれます。文字列インデックスの算術を行う関数は、インデックスに対してより緩やかなアプローチを取り、範囲内の場合は最も近い有効な文字列インデックスを返し、範囲外の場合は文字列の両側に無限の数の文字がパディングされているかのように振る舞います。通常、これらの想像上のパディング文字はコードユニットの長さが1ですが、文字列型はその実装に応じて異なる「想像上の」文字サイズを選択することがあります（例えば、部分文字列は、提供するビューの基になる文字列にインデックス算術を通すことがあります）。緩やかなインデックス関数には、インデックス算術を目的とした関数が含まれます：thisind、nextind、およびprevind。このモデルにより、インデックス算術は、文字を取得するためにそれらを使用しない限り、中間値として範囲外のインデックスで機能することができます。これにより、エッジケースを回避するためのコーディングが不要になることがよくあります。

codeunit、ncodeunits、thisind、nextind、previndも参照してください。

Strings

AnnotatedStrings

`AnnotatedString`s