Strings

Core.AbstractString — Type

AbstractString 타입은 Julia의 모든 문자열 구현의 슈퍼타입입니다. 문자열은 AbstractChar 타입으로 표현된 Unicode 코드 포인트의 시퀀스를 인코딩한 것입니다. Julia는 문자열에 대해 몇 가지 가정을 합니다:

문자열은 고정 크기 "코드 유닛"으로 인코딩됩니다.
- 코드 유닛은 codeunit(s, i)로 추출할 수 있습니다.
- 첫 번째 코드 유닛의 인덱스는 1입니다.
- 마지막 코드 유닛의 인덱스는 ncodeunits(s)입니다.
- 1 ≤ i ≤ ncodeunits(s)인 모든 인덱스 i는 유효한 범위에 있습니다.
문자열 인덱싱은 이러한 코드 유닛을 기준으로 수행됩니다:
- 문자는 유효한 문자열 인덱스 i로 s[i]를 통해 추출됩니다.
- 문자열의 각 AbstractChar는 하나 이상의 코드 유닛으로 인코딩됩니다.
- AbstractChar의 첫 번째 코드 유닛의 인덱스만 유효한 인덱스입니다.
- AbstractChar의 인코딩은 그 앞이나 뒤에 무엇이 오는지와는 독립적입니다.
- 문자열 인코딩은 자기 동기화됩니다 – 즉, isvalid(s, i)는 O(1)입니다.

코드 유닛, 문자 또는 부분 문자열을 문자열에서 추출하는 일부 문자열 함수는 범위를 벗어나거나 유효하지 않은 문자열 인덱스를 전달하면 오류를 발생시킵니다. 여기에는 codeunit(s, i)와 s[i]가 포함됩니다. 문자열 인덱스 산술을 수행하는 함수는 인덱싱에 대해 더 느슨한 접근 방식을 취하며, 범위 내에서는 가장 가까운 유효한 문자열 인덱스를 제공하거나, 범위를 벗어날 경우 문자열의 양쪽에 무한한 수의 문자가 패딩된 것처럼 동작합니다. 일반적으로 이러한 상상의 패딩 문자는 코드 유닛 길이가 1이지만, 문자열 타입은 구현에 맞게 다른 "상상의" 문자 크기를 선택할 수 있습니다 (예: 부분 문자열은 제공하는 기본 문자열에 대한 인덱스 산술을 통과시킬 수 있습니다). 느슨한 인덱싱 함수에는 인덱스 산술을 위한 함수인 thisind, nextind 및 prevind가 포함됩니다. 이 모델은 인덱스 산술이 범위를 벗어난 인덱스를 중간 값으로 사용할 수 있도록 하여, 문자를 검색하는 데 사용하지 않는 한, 엣지 케이스를 피하는 데 도움이 됩니다.

또한 codeunit, ncodeunits, thisind, nextind, prevind를 참조하십시오.

Strings

AnnotatedStrings

`AnnotatedString`s