--- parser3/src/doc/string.dox 2002/04/29 05:59:33 1.4 +++ parser3/src/doc/string.dox 2003/07/24 11:31:20 1.5 @@ -1,41 +1,43 @@ /** @page String String -В памяти строки[String] хранятся в виде списка фрагментов[String::Chunk::Row .item], -каждый помнит язык, на котором написан фрагмент. -Фрагменты, полученные из stdout скриптов считаются чистыми(String::Untaint_lang ::UL_CLEAN), +В памяти строки[String] хранятся в виде букв, и списка фрагментов[String::Fragment] язык фрагмента+его длина. +Фрагменты, полученные из stdout скриптов считаются чистыми(String::Language ::L_CLEAN), а от пользователя - из stderr скриптов, из environment, из form, с диска[table:load] или из sql сервера[table:sql] -считаются испачканными(String::Untaint_lang ::UL_TAINTED), -при операциях со строкой её могут расделять на части, но получающиеся части по-прежнему помнят свой язык. +считаются испачканными(String::Language ::UL_TAINTED), +при операциях со строкой её могут расделять на части, но получающиеся части по-прежнему помнят языки своих фрагментов. Строку могут записать в Request::wcontext, задав ей язык. -При этом язык задаётся всем её испачканным частям, они становятся не неопределённо грязными[UL_TAINTED], +При этом язык задаётся всем её испачканным частям, они становятся не неопределённо грязными[L_TAINTED], а "грязными, но известно, что нужно с ними сделать, чтобы стали чистыми, т.е. известен их язык". скажем @verbatim ^void:sql{insert into news (title) values ('$form:title')] @endverbatim при обработке параметра посредством Temp_lang выставляется "текущий язык"[Request::flang], -и при записи[Request::write_assign_lang] UL_TAINTED строки из $form:title фрагмента параметра -метода sql, находящегося в кавычках, получает язык UL_SQL. +и при записи[Request::write_assign_lang] L_TAINTED строки из $form:title фрагмента параметра +метода sql, находящегося в кавычках, получает язык L_SQL. String можно преобразовать в обычную С-строку, используя String::cstr(). -При этом будут учтены языки фрагментов и произведены соответствующие вычищения. -Также можно воспользоваться String::cstr(String::Untaint_lang), при этом будет все фрагменты строки -насильно будут считаться написанными на этом языке. Безотносительно к указанному во фрагменте языку. +Если задать String::cstr(String::L_UNSPECIFIED), то +при преобразовании будут учтены языки фрагментов и произведены соответствующие вычищения. +Также можно воспользоваться String::cstr(String::Language) [по-умолчанию =L_AS_IS], +при этом будет все фрагменты строки насильно будут считаться написанными на этом языке +безотносительно к указанному во фрагменте языку. Такое используется, например, для работы с именами файлов [ВНИМАНИЕ: никогда и нигде не используйте эту конструкцию, если вам дороги ваши секретные файлы, используется только для примера]: @verbatim $file[^table::load[$form:file_name]] @endverbatim -здесь при обычной обработке $form:file_name вышел бы UL_HTML|UL_OPTIMIZE_BIT, а нужен UL_FILE_SPEC, +здесь при обычной обработке $form:file_name вышел бы L_HTML|L_OPTIMIZE_BIT, а нужен L_FILE_SPEC, при этом глупо всё время подобное делать, как для table:sql, настаивая на {} параметрах. -Обычным языком вывода является String::Untaint_lang::UL_HTML|String::Untaint_lang::UL_OPTIMIZE_BIT, +Обычным языком вывода является String::Language::L_HTML|String::Language::L_OPTIMIZE_BIT, исключение составляет CGI скрипт, который запускают вне веб-сервера, -в этом случае используется язык String::Untaint_lang::UL_AS_IS. +в этом случае используется язык String::Language::L_AS_IS. -В фрагментах, язык которых помечен как OPTIMIZED при преобразовании в строку String::cstr -будут оптимизированы whitespace символы, из нескольких идущих подряд символов будет оставлен первый, -остальные будут удалены. +В фрагментах, язык которых помечен как OPTIMIZED (String::Language::L_OPTIMIZE_BIT), +при преобразовании в строку String::cstr будут оптимизированы whitespace символы: +из нескольких идущих подряд символов будет оставлен первый, остальные в результат не попадут. -*/ \ No newline at end of file +При работе с char* считается, что он никогда не может быть 0. +*/