9.5. Функции и операторы двоичных строк
В этом разделе описываются функции и операторы для работы с данными типа bytea
.
В SQL определены несколько строковых функций, в которых аргументы разделяются не запятыми, а ключевыми словами. Подробнее это описано в Таблице 9.12. Postgres Pro также предоставляет варианты этих функций с синтаксисом, обычным для функций (см. Таблицу 9.13).
Примечание
В примерах, приведённых на этой странице, подразумевается, что параметр сервера bytea_output
равен escape
(выбран традиционный формат Postgres Pro).
Таблица 9.12. SQL-функции и операторы для работы с двоичными строками
Функция | Тип результата | Описание | Пример | Результат |
---|
string || string
| bytea | Конкатенация строк | '\\Post'::bytea || '\047gres\000'::bytea | \\Post'gres\000 |
octet_length(string )
| int | Число байт в двоичной строке | octet_length('jo\000se'::bytea) | 5 |
overlay(string placing string from int [for int ])
| bytea | Заменяет подстроку | overlay('Th\000omas'::bytea placing '\002\003'::bytea from 2 for 3) | T\\002\\003mas |
position(substring in string )
| int | Положение указанной подстроки | position('\000om'::bytea in 'Th\000omas'::bytea) | 3 |
substring(string [from int ] [for int ])
| bytea | Извлекает подстроку | substring('Th\000omas'::bytea from 2 for 3) | h\000o |
trim([both] bytes from string )
| bytea | Удаляет наибольшую строку, содержащую только байты, заданные в параметре bytes , с начала и с конца строки string | trim('\000\001'::bytea from '\000Tom\001'::bytea) | Tom |
В PostgreSQL есть и другие функции для работы с двоичными строками, перечисленные в Таблице 9.13. Некоторые из них используются в качестве внутренней реализации стандартных функций SQL, приведённых в Таблице 9.12.
Таблица 9.13. Другие функции для работы с двоичными строками
Функция | Тип результата | Описание | Пример | Результат |
---|
btrim(string bytea , bytes bytea )
| bytea | Удаляет наибольшую строку, содержащую только байты, заданные в параметре bytes , с начала и с конца строки string | btrim('\000trim\001'::bytea, '\000\001'::bytea) | trim |
decode(string text , format text )
| bytea | Получает двоичные данные из текстового представления в string . Значения параметра format те же, что и для функции encode . | decode('123\000456', 'escape') | 123\000456 |
encode(data bytea , format text )
| text | Переводит двоичные данные в текстовое представление в одном из форматов: base64 , hex , escape . Формат escape преобразует нулевые байты и байты с 1 в старшем бите в восьмеричные последовательности \nnn и дублирует обратную косую черту. | encode('123\000456'::bytea, 'escape') | 123\000456 |
get_bit(string , offset )
| int | Извлекает бит из строки | get_bit('Th\000omas'::bytea, 45) | 1 |
get_byte(string , offset )
| int | Извлекает байт из строки | get_byte('Th\000omas'::bytea, 4) | 109 |
length(string )
| int | Длина двоичной строки | length('jo\000se'::bytea) | 5 |
md5(string )
| text | Вычисляет MD5-хеш строки string и возвращает результат в 16-ричном виде | md5('Th\000omas'::bytea) | 8ab2d3c9689aaf18b4958c334c82d8b1 |
set_bit(string , offset , newvalue )
| bytea | Устанавливает значение бита в строке | set_bit('Th\000omas'::bytea, 45, 0) | Th\000omAs |
set_byte(string , offset , newvalue )
| bytea | Устанавливает значение байта в строке | set_byte('Th\000omas'::bytea, 4, 64) | Th\000o@as |
sha224(bytea )
| bytea | Хеш SHA-224 | sha224('abc') | \x23097d223405d8228642a477bda255b32aadbce4bda0b3f7e36c9da7 |
sha256(bytea )
| bytea | Хеш SHA-256 | sha256('abc') | \xba7816bf8f01cfea414140de5dae2223b00361a396177a9cb410ff61f20015ad |
sha384(bytea )
| bytea | Хеш SHA-384 | sha384('abc') | \xcb00753f45a35e8bb5a03d699ac65007272c32ab0eded1631a8b605a43ff5bed8086072ba1e7cc2358baeca134c825a7 |
sha512(bytea )
| bytea | Хеш SHA-512 | sha512('abc') | \xddaf35a193617abacc417349ae20413112e6fa4e89a97ea20a9eeee64b55d39a2192992a274fc1a836ba3c23a3feebbd454d4423643ce80e2a9ac94fa54ca49f |
Для функций get_byte
и set_byte
байты нумеруется с 0. Функции get_bit
и set_bit
нумеруют биты справа налево; например, бит 0 будет меньшим значащим битом первого байта, а бит 15 — большим значащим битом второго байта.
Заметьте, что по историческим причинам функция md5
возвращает значение в шестнадцатеричном виде в типе text
, тогда как функции SHA-2 возвращают тип bytea
. Используйте функции encode
и decode
для преобразования значений из одного представления в другое. Например, вызвав encode(sha256('abc'), 'hex')
, вы получите значение в шестнадцатеричном виде в строке.
См. также агрегатную функцию string_agg
в Разделе 9.20 и функции для работы с большими объектами в Разделе 32.4.