Strings

Core.AbstractString — Type

AbstractString型は、Juliaにおけるすべての文字列実装のスーパークラスです。文字列は、AbstractChar型によって表されるUnicodeコードポイントのシーケンスのエンコーディングです。Juliaは文字列についていくつかの仮定をしています：

文字列は固定サイズの「コードユニット」に基づいてエンコードされています。
- コードユニットはcodeunit(s, i)で抽出できます
- 最初のコードユニットのインデックスは1です
- 最後のコードユニットのインデックスはncodeunits(s)です
- 1 ≤ i ≤ ncodeunits(s)を満たす任意のインデックスiは範囲内です
文字列のインデックスはこれらのコードユニットに基づいて行われます：
- 文字は有効な文字列インデックスiを使ってs[i]で抽出されます
- 文字列内の各AbstractCharは1つ以上のコードユニットでエンコードされています
- AbstractCharの最初のコードユニットのインデックスのみが有効なインデックスです
- AbstractCharのエンコーディングは、その前後に何があるかに依存しません
- 文字列のエンコーディングは自己同期しており、すなわちisvalid(s, i)はO(1)です

コードユニット、文字、または部分文字列を文字列から抽出するいくつかの文字列関数は、範囲外または無効な文字列インデックスを渡すとエラーになります。これにはcodeunit(s, i)やs[i]が含まれます。文字列インデックスの算術を行う関数は、インデックスに対してより緩やかなアプローチを取り、範囲内のときには最も近い有効な文字列インデックスを返し、範囲外のときには文字列の両側に無限の数の文字がパディングされているかのように振る舞います。通常、これらの想像上のパディング文字はコードユニットの長さが1ですが、文字列型はその実装に応じて異なる「想像上の」文字サイズを選択することがあります（例：部分文字列は、提供するビューの基になる文字列にインデックス算術を通すことがあります）。緩やかなインデックス関数には、インデックス算術を目的としたものが含まれます：thisind、nextind、およびprevind。このモデルにより、インデックス算術は範囲外のインデックスを中間値として扱うことができ、文字を取得するためにそれらを使用しない限り、エッジケースを回避するのに役立ちます。

また、codeunit、ncodeunits、thisind、nextind、previndも参照してください。

Strings

AnnotatedStrings

`AnnotatedString`s