Strings

Core.AbstractString — Type

Тип AbstractString является суперклассом всех реализаций строк в Julia. Строки представляют собой кодировки последовательностей Unicode кодовых точек, как это представлено типом AbstractChar. Julia делает несколько предположений о строках:

Строки закодированы в терминах фиксированного размера "кодовых единиц"
- Кодовые единицы можно извлечь с помощью codeunit(s, i)
- Первая кодовая единица имеет индекс 1
- Последняя кодовая единица имеет индекс ncodeunits(s)
- Любой индекс i, такой что 1 ≤ i ≤ ncodeunits(s), находится в пределах
Индексация строк осуществляется в терминах этих кодовых единиц:
- Символы извлекаются с помощью s[i] с допустимым индексом строки i
- Каждая AbstractChar в строке закодирована одной или несколькими кодовыми единицами
- Только индекс первой кодовой единицы AbstractChar является допустимым индексом
- Кодировка AbstractChar независима от того, что предшествует или следует за ней
- Кодировки строк являются самосинхронизирующимися – т.е. isvalid(s, i) имеет сложность O(1)

Некоторые функции строк, которые извлекают кодовые единицы, символы или подстроки из строк, выдают ошибку, если вы передаете им индексы строк вне пределов или недопустимые индексы строк. Это включает codeunit(s, i) и s[i]. Функции, которые выполняют арифметику индексов строк, принимают более расслабленный подход к индексации и предоставляют вам ближайший допустимый индекс строки, когда он в пределах, или, когда он вне пределов, ведут себя так, как будто с каждой стороны строки есть бесконечное количество символов для заполнения. Обычно эти воображаемые символы заполнения имеют длину кодовой единицы 1, но типы строк могут выбирать разные размеры "воображаемых" символов, которые имеют смысл для их реализаций (например, подстроки могут передавать арифметику индексов в основную строку, в которую они предоставляют представление). Функции с расслабленной индексацией включают те, которые предназначены для арифметики индексов: thisind, nextind и prevind. Эта модель позволяет арифметике индексов работать с индексами вне пределов как промежуточными значениями, при условии, что их никогда не используют для извлечения символа, что часто помогает избежать необходимости кодировать вокруг крайних случаев.

См. также codeunit, ncodeunits, thisind, nextind, prevind.

Strings

AnnotatedStrings

`AnnotatedString`s