--- parser3/src/main/pa_string.C	2001/12/25 09:00:28	1.136
+++ parser3/src/main/pa_string.C	2003/01/24 14:36:11	1.172.2.5
@@ -1,128 +1,59 @@
 /** @file
 	Parser: string class. @see untasize_t.C.
 
-	Copyright (c) 2001 ArtLebedev Group (http://www.artlebedev.com)
-	Author: Alexander Petrosyan <paf@design.ru> (http://paf.design.ru)
-
-	$Id: pa_string.C,v 1.136 2001/12/25 09:00:28 paf Exp $
+	Copyright (c) 2001, 2003 ArtLebedev Group (http://www.artlebedev.com)
+	Author: Alexandr Petrosian <paf@design.ru> (http://paf.design.ru)
 */
 
+static const char* IDENT_STRING_C="$Date: 2003/01/24 14:36:11 $";
+
 #include "pcre.h"
 
 #include "pa_pool.h"
 #include "pa_string.h"
-#include "pa_hash.h"
 #include "pa_exception.h"
-#include "pa_common.h"
 #include "pa_array.h"
-#include "pa_globals.h"
 #include "pa_table.h"
 #include "pa_dictionary.h"
 #include "pa_charset.h"
 
-String::String(Pool& apool, const char *src, size_t src_size, bool tainted) :
-	Pooled(apool) {
-	last_chunk=&head;
-	head.count=CR_PREALLOCATED_COUNT;
-	append_here=head.rows;
-	head_link=0;
-	link_row=&head.rows[head.count];
+// helpers
 
-	if(src)
-		if(tainted)
-			APPEND_TAINTED(src, src_size, 0, 0);
-		else
-			APPEND_CLEAN(src, src_size, 0, 0);
-}
+/// String::match uses this as replace & global search table columns
 
-String::String(const String& src) :	
-	Pooled(src.pool()) {
-	head.count=CR_PREALLOCATED_COUNT;
-	
-	uint src_used_rows=src.used_rows();
-	if(src_used_rows<=head.count) {
-		// all new rows fit size_to preallocated area
-		last_chunk=&head;
-		uint curr_chunk_rows=head.count;
-		memcpy(head.rows, src.head.rows, sizeof(Chunk::Row)*src_used_rows);
-		append_here=&head.rows[src_used_rows];
-		link_row=&head.rows[curr_chunk_rows];
-	} else {
-		// warning: 
-		//   heavily relies on the fact 
-		//   "preallocated area is the same for all strings"
-		//
-		// info:
-		//   allocating only enough mem to fit src string rows
-		//   next append would allocate a new chunk
-		//
-		// new rows don't fit size_to preallocated area: splitting size_to two chunks
-		// preallocated chunk src to constructing head
-		memcpy(head.rows, src.head.rows, sizeof(Chunk::Row)*head.count);
-		// remaining rows size_to new_chunk
-		uint curr_chunk_rows=src_used_rows-head.count;
-		last_chunk=static_cast<Chunk *>(
-			malloc(sizeof(uint)+sizeof(Chunk::Row)*curr_chunk_rows+sizeof(Chunk *), 9));
-		last_chunk->count=curr_chunk_rows;
-		head_link=last_chunk;
-		append_here=link_row=&last_chunk->rows[last_chunk->count];
-
-		Chunk *old_chunk=src.head_link; 
-		Chunk::Row *new_rows=last_chunk->rows;
-		uint rows_left_to_copy=last_chunk->count;
-		while(true) {
-			uint old_count=old_chunk->count;
-			Chunk *next_chunk=old_chunk->rows[old_count].link;
-			if(next_chunk) {
-				// not last source chunk
-				// taking it all
-				memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*old_count);
-				new_rows+=old_count;
-				rows_left_to_copy-=old_count;
+const int MAX_MATCH_GROUPS=100;
 
-				old_chunk=next_chunk;
-			} else {
-				// the last source chunk
-				// taking only those rows of chunk that _left_to_copy
-				memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*rows_left_to_copy);
-				break;
-			}
+class String_match_table_template_columns: public Array<ConstStringPtr> {
+	Pool pool;
+public:
+	String_match_table_template_columns() {
+		*this+=ConstStringPtr(new String("prematch"));
+		*this+=ConstStringPtr(new String("match"));
+		*this+=ConstStringPtr(new String("postmatch"));
+		for(int i=0; i<MAX_MATCH_GROUPS; i++) {
+			char *cname=new(pool) char[3/*strlen("100")*/+1/*terminating 0*/];
+			ConstStringPtr sname(new String(cname, sprintf(cname, "%d", 1+i)));
+			*this+=sname;
 		}
 	}
-	link_row->link=0;
-	src_used_rows;
-}
+};
 
-size_t  String::size() const {
-	size_t result=0;
-	STRING_FOREACH_ROW(
-			result+=row->item.size;
-	);
-break2:
-	return result;
-}
+Table string_match_table_template(
+								  String::undefined_origin, 
+								  Table::columns_type(new String_match_table_template_columns));
 
-/// @todo not very optimal
-uint String::used_rows() const {
-	uint result=0;
-	STRING_FOREACH_ROW(
-		result++;
-	);
-break2:
-	return result;
+// methods
+
+String::String(const char *src, size_t src_size, bool tainted): Array<String_fragment>(1), fsize(0) {
+	if(src)
+		if(tainted)
+			APPEND_TAINTED(src, src_size, 0, 0);
+		else
+			APPEND_CLEAN(src, src_size, 0, 0);
 }
-void String::expand() {
-	uint new_chunk_count=last_chunk->count+CR_GROW_COUNT;
-	if(new_chunk_count>MAX_USHORT)
-		new_chunk_count=MAX_USHORT;
-
-	last_chunk=static_cast<Chunk *>(
-		malloc(sizeof(uint)+sizeof(Chunk::Row)*new_chunk_count+sizeof(Chunk *), 10));
-	last_chunk->count=new_chunk_count;
-	link_row->link=last_chunk;
-	append_here=last_chunk->rows;
-	link_row=&last_chunk->rows[last_chunk->count];
-	link_row->link=0;
+
+String::String(const String& src): Array<String_fragment>(src.count()) {
+	append(src, UL_PASS_APPENDED);
 }
 
 String& String::real_append(STRING_APPEND_PARAMS) {
@@ -133,53 +64,26 @@ String& String::real_append(STRING_APPEN
 	if(!size)
 		return *this;
 
-	while(size>MAX_USHORT) {
-		if(chunk_is_full())
-			expand();
-
-		append_here->item.ptr=src;
-		append_here->item.size=MAX_USHORT;
-		append_here->item.lang=lang;
-#ifndef NO_STRING_ORIGIN
-		append_here->item.origin.file=file;
-		append_here->item.origin.line=line;
-#endif
-		append_here++;
-
-		src+=MAX_USHORT;
-		size-=MAX_USHORT;
-	}
+	if(is_full())
+		expand(fdelta);
 
-	if(chunk_is_full())
-		expand();
-
-	append_here->item.ptr=src;
-	append_here->item.size=size;
-	append_here->item.lang=lang;
+	String_fragment *fragment=&felements[fused++];
+	fragment->ptr=src;
+	fragment->size=size;
+	fragment->lang=lang;
 #ifndef NO_STRING_ORIGIN
-	append_here->item.origin.file=file;
-	append_here->item.origin.line=line;
+	fragment->origin.file=file;
+	fragment->origin.line=line;
 #endif
-	append_here++;
 
 	return *this;
 }
 
-char String::first_char() const {
-	if(!used_rows())
-		throw Exception(0, 0,
-			this,
-			"getting first char of empty string");
-
-	return *head.rows[0].item.ptr;
-}
-
 uint String::hash_code() const {
 	uint result=0;
-	STRING_FOREACH_ROW(
-			result=Hash::generic_code(result, row->item.ptr, row->item.size);
+	STRING_FOREACH_FRAGMENT(
+		result=generic_hash_code(result, fragment->ptr, fragment->size);
 	);
-break2:
 	return result;
 }
 
@@ -190,77 +94,56 @@ int String::cmp(int& partial, const Stri
 	size_t a_size=size();
 	this_offset=min(this_offset, a_size-1);
 
-	const Chunk *a_chunk=&head;
-	const Chunk *b_chunk=&src.head;
-	const Chunk::Row *a_row=a_chunk->rows;
-	const Chunk::Row *b_row=b_chunk->rows;
+	const String_fragment *a_current=felements;
+	const String_fragment *b_current=src.felements;
 	size_t a_offset=this_offset;
 	size_t b_offset=0;
-	Chunk::Row *a_end=append_here;
-	Chunk::Row *b_end=src.append_here;
-	uint a_countdown=a_chunk->count;
-	uint b_countdown=b_chunk->count;
+	String_fragment *a_end=felements+fused;
+	String_fragment *b_end=src.felements+src.fused;
 	int result;
 	size_t pos=0; 
 
-	bool a_break=a_size==0;
-	bool b_break=src.size()==0;
-	if(!(a_break || b_break)) while(true) {
-		if(pos+a_row->item.size > this_offset) {
-			if(lang!=UL_UNSPECIFIED && a_row->item.lang>lang) 
+	bool a_break;
+	bool b_break;
+	while(!(
+		(a_break=(a_current==a_end))
+		|| (b_break=(b_current==b_end)))) {
+		if(pos+a_current->size > this_offset) {
+			if(lang!=UL_UNSPECIFIED && a_current->lang>lang) 
 				return -1; // wrong lang -- bail out
 
 			int size_diff=
-				(a_row->item.size-a_offset)-
-				(b_row->item.size-b_offset);
+				(a_current->size-a_offset)-
+				(b_current->size-b_offset);
 			
 			if(size_diff==0) { // a has same size as b
-				result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, 
-					a_row->item.size-a_offset);
+				result=memcmp(a_current->ptr+a_offset, b_current->ptr+b_offset, 
+					a_current->size-a_offset);
 				if(result)
 					return result;
-				pos+=a_row->item.size;
-				a_row++; a_countdown--; a_offset=0;
-				b_row++; b_countdown--; b_offset=0;
-			} else if (size_diff>0) { // a longer
-				result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, 
-					b_row->item.size-b_offset);
+				pos+=a_current->size;
+				a_current++; a_offset=0;
+				b_current++; b_offset=0;
+			} else if(size_diff>0) { // a longer
+				result=memcmp(a_current->ptr+a_offset, b_current->ptr+b_offset, 
+					b_current->size-b_offset);
 				if(result)
 					return result;
-				a_offset+=b_row->item.size-b_offset;
-				b_row++; b_countdown--; b_offset=0;
+				a_offset+=b_current->size-b_offset;
+				b_current++; b_offset=0;
 			} else { // b longer
-				result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, 
-					a_row->item.size-a_offset);
+				result=memcmp(a_current->ptr+a_offset, b_current->ptr+b_offset, 
+					a_current->size-a_offset);
 				if(result)
 					return result;
-				b_offset+=a_row->item.size-a_offset;
-				pos+=a_row->item.size;
-				a_row++; a_countdown--; a_offset=0;
-			}
-			if(b_break=b_row==b_end) {
-				a_break=a_row==a_end;
-				break;			
-			}
-			if(!b_countdown) {
-				b_chunk=b_row->link;
-				b_row=b_chunk->rows;
-				b_countdown=b_chunk->count;
+				b_offset+=a_current->size-a_offset;
+				pos+=a_current->size;
+				a_current++; a_offset=0;
 			}
 		} else {
-			a_offset-=a_row->item.size;
-			pos+=a_row->item.size;
-			a_row++; a_countdown--; 
-		}
-
-		if(a_break=a_row==a_end) {
-			b_break=b_row==b_end;
-			break;
-		}
-		if(!a_countdown) {
-			a_chunk=a_row->link;
-			a_row=a_chunk->rows;
-			a_countdown=a_chunk->count;
+			a_offset-=a_current->size;
+			pos+=a_current->size;
+			a_current++;
 		}
 	}
 	if(a_break==b_break) { // ended simultaneously
@@ -280,59 +163,50 @@ int String::cmp(int& partial, const char
 	size_t b_size=src_size?src_size:b_ptr?strlen(b_ptr):0;
 	this_offset=min(this_offset, a_size-1);
 
-	const Chunk *a_chunk=&head;
-	const Chunk::Row *a_row=a_chunk->rows;
+	const String_fragment *a_current=felements;
 	size_t a_offset=this_offset;
 	size_t b_offset=0;
-	Chunk::Row *a_end=append_here;
-	uint a_countdown=a_chunk->count;
+	String_fragment *a_end=felements+fused;
 	size_t pos=0;
 
-	bool a_break=a_size==0;
+	bool a_break;
 	bool b_break=b_size==0;
-	if(!(a_break || b_break)) while(true) {
-		if(pos+a_row->item.size > this_offset) {
-			if(lang!=UL_UNSPECIFIED && a_row->item.lang>lang) 
+	while(!(
+		(a_break=(a_current==a_end))
+		|| b_break)) {
+		if(pos+a_current->size > this_offset) {
+			if(lang!=UL_UNSPECIFIED && a_current->lang>lang) 
 				return -1; // wrong lang -- bail out
 
 			int size_diff=
-				(a_row->item.size-a_offset)-
+				(a_current->size-a_offset)-
 				(b_size-b_offset);
 			
 			if(size_diff==0) { // a has same size as b
-				if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, 
-					a_row->item.size-a_offset)!=0)
+				if(int result=memcmp(a_current->ptr+a_offset, b_ptr+b_offset, 
+					a_current->size-a_offset)!=0)
 					return result;
-				pos+=a_row->item.size;
-				a_row++; a_countdown--; a_offset=0;
+				pos+=a_current->size;
+				a_current++; a_offset=0;
 				b_break=true;
 			} else if (size_diff>0) { // a longer
-				if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, 
+				if(int result=memcmp(a_current->ptr+a_offset, b_ptr+b_offset, 
 					b_size-b_offset)!=0)
 					return result;
 				a_offset+=b_size-b_offset;
 				b_break=true;
 			} else { // b longer
-				if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, 
-					a_row->item.size-a_offset)!=0)
+				if(int result=memcmp(a_current->ptr+a_offset, b_ptr+b_offset, 
+					a_current->size-a_offset)!=0)
 					return result;
-				b_offset+=a_row->item.size-a_offset;
-				pos+=a_row->item.size;
-				a_row++; a_countdown--; a_offset=0;
+				b_offset+=a_current->size-a_offset;
+				pos+=a_current->size;
+				a_current++; a_offset=0;
 			}
 		} else {
-			a_offset-=a_row->item.size; 
-			pos+=a_row->item.size;
-			a_row++; a_countdown--; 
-		}
-
-		a_break=a_row==a_end;
-		if(a_break || b_break)
-			break;
-		if(!a_countdown) {
-			a_chunk=a_row->link;
-			a_row=a_chunk->rows;
-			a_countdown=a_chunk->count;
+			a_offset-=a_current->size; 
+			pos+=a_current->size;
+			a_current++; 
 		}
 	}
 	if(a_break==b_break) { // ended simultaneously
@@ -345,47 +219,47 @@ int String::cmp(int& partial, const char
 }
 
 #ifndef NO_STRING_ORIGIN
-const Origin& String::origin() const { 
-	if(!used_rows()) {
-		static const Origin empty_origin={"empty string"};
+const String_fragment::Origin& String::origin() const { 
+	if(is_empty()) {
+		static const String_fragment::Origin empty_origin={"empty string"};
 		return empty_origin;
 	}
 	
-	// determining origin by last appended piece
-	// because first one frequently constant. 
+	// determining origin by first piece or last appended piece
+	// because any of them can be constant=without origin: 
 	// ex: ^load[/file] "document_root" + "/file"
 	// when last peice is constant, 
 	// ex: parser_root_auto_path{dynamic} / auto.p{const}
 	// using first piece
-	Origin& last_origin=append_here[-1].item.origin;
-	return last_origin.file ? last_origin : head.rows[0].item.origin;
+	String_fragment::Origin& first_origin=felements[0].origin;
+	return first_origin.file ? first_origin : felements[fused-1].origin;
 }
 #endif
 
-String& String::mid(size_t start, size_t finish) const {
-	String& result=*NEW String(pool());
+StringPtr String::mid(size_t start, size_t finish) const {
+	StringPtr result(new String());
 
-	start=max(0, start);
-	finish=min(size(), finish);
+	start=min(start, size());
+	finish=max(start, finish);
 	if(start==finish)
 		return result;
 
 	size_t pos=0;
-	STRING_FOREACH_ROW(
-		size_t item_finish=pos+row->item.size;
+	STRING_FOREACH_FRAGMENT(
+		size_t item_finish=pos+fragment->size;
 		if(item_finish > start) { // started now or already?
-			bool started=result.size()==0; // started now?
+			bool started=result->is_empty(); // started now?
 			bool finished=finish <= item_finish; // finished now?
 			size_t offset=started?start-pos:0;
-			size_t size=finished?finish-pos:row->item.size;
-			result.APPEND(
-				row->item.ptr+offset, size-offset, 
-				row->item.lang,
-				row->item.origin.file, row->item.origin.line);
+			size_t size=finished?finish-pos:fragment->size;
+			result->APPEND(
+				fragment->ptr+offset, size-offset, 
+				fragment->lang,
+				fragment->origin.file, fragment->origin.line);
 			if(finished)
 				goto break2;
 		}
-		pos+=row->item.size;
+		pos+=fragment->size;
 	);
 break2:
 //	SAPI::log(pool(), "piece of '%s' from %d to %d is '%s'",
@@ -421,7 +295,7 @@ int String::pos(const char *substr, size
 	return -1;
 }
 
-void String::split(Array& result, 
+void String::split(Array<ConstStringPtr>& result, 
 				   size_t* pos_after_ref, 
 				   const char *delim, size_t delim_size, 
 				   Untaint_lang lang, int limit) const {
@@ -431,170 +305,178 @@ void String::split(Array& result,
 		int pos_before;
 		// while we have 'delim'...
 		for(; (pos_before=pos(delim, delim_size, pos_after, lang))>=0 && limit; limit--) {
-			result+=&mid(pos_after, pos_before);
+			result+=mid(pos_after, pos_before);
 			pos_after=pos_before+delim_size;
 		}
 		// last piece
 		if(pos_after<self_size && limit) {
-			result+=&mid(pos_after, self_size);
+			result+=mid(pos_after, self_size);
 			pos_after=self_size;
 		}
 		if(pos_after_ref)
 			*pos_after_ref=pos_after;
 	} else { // empty delim
-		result+=this;
+		result+=ConstStringPtr(this);
 		if(pos_after_ref)
 			*pos_after_ref+=self_size;
 	}
 }
 
-void String::split(Array& result, 
+void String::split(Array<ConstStringPtr>& result, 
 				   size_t* pos_after_ref, 
 				   const String& delim, Untaint_lang lang, 
 				   int limit) const {
-	if(delim.size()) {
+	if(!delim.is_empty()) {
 		size_t pos_after=pos_after_ref?*pos_after_ref:0;
 		int pos_before;
 		// while we have 'delim'...
 		for(; (pos_before=pos(delim, pos_after, lang))>=0 && limit; limit--) {
-			result+=&mid(pos_after, pos_before);
+			result+=mid(pos_after, pos_before);
 			pos_after=pos_before+delim.size();
 		}
 		// last piece
 		if(pos_after<size() && limit) {
-			result+=&mid(pos_after, size());
+			result+=mid(pos_after, size());
 			pos_after=size();
 		}
 		if(pos_after_ref)
 			*pos_after_ref=pos_after;
 	} else { // empty delim
-		result+=this;
+		result+=ConstStringPtr(this);
 		if(pos_after_ref)
 			*pos_after_ref+=size();
 	}
 }
 
-static void regex_options(char *options, int *result){
+static void regex_options(ConstStringPtr options, int *result, bool& need_pre_post_match){
     struct Regex_option {
-		char key;
+		const char *keyL;
+		const char *keyU;
 		int clear, set;
 		int *result;
+		bool *flag;
     } regex_option[]={
-		{'i', 0, PCRE_CASELESS, result}, // a=A
-		{'s', 0, PCRE_DOTALL, result}, // \n\n$ [default]
-		{'x', 0, PCRE_EXTENDED, result}, // whitespace in regex ignored
-		{'m', PCRE_DOTALL, PCRE_MULTILINE, result}, // ^aaa\n$^bbb\n$
-		{'g', 0, true, result+1}, // many rows
-		{0},
+		{"i", "I", 0, PCRE_CASELESS, result}, // a=A
+		{"s", "S", 0, PCRE_DOTALL, result}, // \n\n$ [default]
+		{"x", "U", 0, PCRE_EXTENDED, result}, // whitespace in regex ignored
+		{"m", "M", PCRE_DOTALL, PCRE_MULTILINE, result}, // ^aaa\n$^bbb\n$
+		{"g", "G", 0, true, result+1}, // many rows
+		{"'", 0, 0, 0, 0, &need_pre_post_match},
+		{0}
     };
-	result[0]=PCRE_EXTRA | PCRE_DOTALL;
+	result[0]=PCRE_EXTRA | PCRE_DOTALL | PCRE_DOLLAR_ENDONLY;
 	result[1]=0;
 
     if(options) 
-		for(Regex_option *o=regex_option; o->key; o++) 
-			if(
-				strchr(options, o->key) || 
-				strchr(options, toupper(o->key))) {
-				*(o->result)&=~o->clear;
-				*(o->result)|=o->set;
+		for(Regex_option *o=regex_option; o->keyL; o++) 
+			if(options->pos(o->keyL)>=0
+				|| (o->keyU && options->pos(o->keyU)>=0)) {
+				if(o->flag)
+					*o->flag=true;
+				else { // result
+					*o->result &= ~o->clear;
+					*o->result |= o->set;
+				}
 			}
 }
 
-/// @todo maybe need speedup: some option to remove pre/match/post string generation
-bool String::match(
-				   const String *aorigin,
-				   const String& regexp, 
-				   const String *options,
-				   Table **table,
-				   Row_action row_action, void *info,
-				   bool *was_global) const { 
+TablePtr String::match(Charset& source_charset,
+					   ConstStringPtr aorigin,		
+					   const String& regexp, 
+					   ConstStringPtr options,
+					   Row_action row_action, void *info,
+					   bool *was_global) const { 
 
-	if(!regexp.size())
-		throw Exception(0, 0,
+	if(regexp.is_empty())
+		throw Exception(0,
 			aorigin,
 			"regexp is empty");
-	const char *pattern=regexp.cstr();
+
+	CharPtr pattern=regexp.cstr();
 	const char *errptr;
 	int erroffset;
-    int option_bits[2];  regex_options(options?options->cstr():0, option_bits);
+    bool need_pre_post_match=false;
+	int option_bits[2];  regex_options(options, option_bits, need_pre_post_match);
 	if(was_global)
 		*was_global=option_bits[1]!=0;
-	pcre *code=pcre_compile(pattern, option_bits[0], 
+	pcre *code=pcre_compile(pattern.get(), option_bits[0], 
 		&errptr, &erroffset,
-		pool().get_source_charset().pcre_tables);
+		source_charset.pcre_tables);
 
 	if(!code)
-		throw Exception(0, 0,
-			&regexp.mid(erroffset, regexp.size()),
+		throw Exception(0,
+			regexp.mid(erroffset, regexp.size()),
 			"regular expression syntax error - %s", errptr);
 	
 	int info_substrings=pcre_info(code, 0, 0);
 	if(info_substrings<0) {
 		pcre_free(code);
-		throw Exception(0, 0,
+		throw Exception(0,
 			aorigin,
 			"pcre_info error (%d)", 
 				info_substrings);
 	}
 
-	int startoffset=0;
-	const char *subject=cstr();
-	int length=strlen(subject);
-	int ovecsize;
-	int *ovector=(int *)malloc(sizeof(int)*
-		(ovecsize=(1/*match*/+info_substrings)*3), 11);
-
-	{ // create table
-		Array& columns=*NEW Array(pool());
-		columns+=string_pre_match_name;
-		columns+=string_match_name;
-		columns+=string_post_match_name;
-		for(int i=1; i<=info_substrings; i++) {
-			char *column=(char *)malloc(MAX_NUMBER);
-			snprintf(column, MAX_NUMBER, "%d", i);
-			columns+=NEW String(pool(), column); // .i column name
-		}
-		*table=NEW Table(pool(), aorigin, &columns);
-	}
+	CharPtr subject=cstr();
+	int length=size();
+	const int ovecsize=(1/*match*/+MAX_MATCH_GROUPS)*3;
+	int ovector[ovecsize];
+
+	// create table
+	TablePtr result(new Table(string_match_table_template));
 
 	int exec_option_bits=0;
+	int prestart=0;
+	int poststart=0;
+	int postfinish=size();
 	while(true) {
 		int exec_substrings=pcre_exec(code, 0,
-			subject, length, startoffset,
+			subject.get(), length, prestart,
 			exec_option_bits, ovector, ovecsize);
 		
 		if(exec_substrings==PCRE_ERROR_NOMATCH) {
 			pcre_free(code);
-			row_action(**table, 0/*last time, no row*/, 0, 0, info);
-			return option_bits[1]!=0; // global=true+table, not global=false
+			row_action(*result.get(), 0/*last time, no raw*/, 0, 0, poststart, postfinish, info);
+			if(option_bits[1])
+				return result; // global=true+result
+			else
+				return TablePtr(0);// not global=no result
 		}
 
 		if(exec_substrings<0) {
 			pcre_free(code);
-			throw Exception(0, 0,
+			throw Exception(0,
 				aorigin,
 				"regular expression execute error (%d)", 
 					exec_substrings);
 		}
 
-		Array& row=*NEW Array(pool());
-		row+=&mid(0, ovector[0]); // .prematch column value
-		row+=&mid(ovector[0], ovector[1]); // .match
-		row+=&mid(ovector[1], size()); // .postmatch
+		int prefinish=ovector[0];
+		poststart=ovector[1];
+		object_ptr<Array<ConstStringPtr> > row;
+		if(need_pre_post_match) {
+			*row+=mid(0, prefinish); // .prematch column value
+			*row+=mid(prefinish, poststart); // .match
+			*row+=mid(poststart, postfinish); // .postmatch
+		} else {
+			*row+=ConstStringPtrZero; // .prematch column value
+			*row+=ConstStringPtrZero; // .match
+			*row+=ConstStringPtrZero; // .postmatch
+		}
 		
 		for(int i=1; i<exec_substrings; i++) {
 			// -1:-1 case handled peacefully by mid() itself
-			row+=&mid(ovector[i*2+0], ovector[i*2+1]); // .i column value
+			*row+=mid(ovector[i*2+0], ovector[i*2+1]); // .i column value
 		}
 		
-		row_action(**table, &row, startoffset, ovector[0], info);
+		row_action(*result, row.get(), prestart, prefinish, poststart, postfinish, info);
 
-		if(!option_bits[1] || startoffset==ovector[1]) { // not global | going to hang
+		if(!option_bits[1] || prestart==poststart) { // not global | going to hang
 			pcre_free(code);
-			row_action(**table, 0/*last time, no row*/, 0, 0, info);
-			return true;
+			row_action(*result, 0/*last time, no row*/, 0, 0, poststart, postfinish, info);
+			return result;
 		}
-		startoffset=ovector[1];
+		prestart=poststart;
 
 /*
 		if(option_bits[0] & PCRE_MULTILINE)
@@ -603,10 +485,10 @@ bool String::match(
 	}
 }
 
-String& String::change_case(Pool& pool, 
-							Change_case_kind kind) const {
-	const unsigned char *tables=pool.get_source_charset().pcre_tables;
-	String& result=*new(pool) String(pool);
+StringPtr String::change_case(Pool& pool, Charset& source_charset, Change_case_kind kind) const {
+	StringPtr result(new String());
+
+	const unsigned char *tables=source_charset.pcre_tables;
 
 	const unsigned char *a;
 	const unsigned char *b;
@@ -620,196 +502,136 @@ String& String::change_case(Pool& pool,
 		b=0;
 		break;
 	default:
-		throw Exception(0, 0, 
-			this, 
+		throw Exception(0, 
+			ConstStringPtr(this), 
 			"unknown change case kind #%d", 
 				static_cast<int>(kind)); // never
 		a=b=0; // calm, compiler
 		break; // never
 	}	
 
-	const Chunk *chunk=&head; 
-	do {
-		const Chunk::Row *row=chunk->rows;
-		for(uint i=0; i<chunk->count; i++, row++) {
-			if(row==append_here)
-				goto break2;
-
-			char *new_cstr=(char *)pool.malloc(row->item.size, 12);
-			char *dest=new_cstr;
-			const char *src=row->item.ptr; 
-			for(int size=row->item.size; size--; src++) {
-				unsigned char c=a[(unsigned char)*src];
-				if(b)
-					c=b[c];
+	STRING_FOREACH_FRAGMENT(
+		char *new_cstr=new(pool) char[fragment->size];
+		char *dest=new_cstr;
+		const char *end=fragment->ptr+fragment->size;
+		for(const char *current=fragment->ptr; current<end; current++) {
+			unsigned char c=a[(unsigned char)*current];
+			if(b)
+				c=b[c];
 
-				*dest++=(char)c;
-			}
-			
-			result.APPEND(new_cstr, row->item.size, 
-				row->item.lang,
-				row->item.origin.file, row->item.origin.line);
+			*dest++=(char)c;
 		}
-		chunk=row->link;
-	} while(chunk);
-break2:
+		
+		result->APPEND(new_cstr, fragment->size, 
+			fragment->lang,
+			fragment->origin.file, fragment->origin.line);
+	);
 
 	return result;
 }
 
-void String::join_chain(Pool& pool, 
-					   uint& ai, const Chunk*& achunk, const Chunk::Row*& arow,
-					   uchar& joined_lang, const char *& joined_ptr, size_t& joined_size) const {
-	joined_lang=arow->item.lang;
-	
-	// calc size
-	joined_size=0;
-	{
-		uint start_i=ai;
-		const Chunk::Row *start_row=arow;
-		const Chunk *chunk=achunk;
-		do {
-			const Chunk::Row *row=start_row;
-			for(uint i=start_i; i<chunk->count; i++, row++) {
-				if(row==append_here)
-					goto break21;
-				
-				if(row->item.lang==joined_lang)
-					joined_size+=row->item.size;
-				else
-					goto break21;
-			}
-			if(chunk=row->link) {
-				start_i=0;
-				start_row=chunk->rows;
-			} else
-				break;
-		} while(true);
-break21:;
-	}
-
-	// if one row, return simply itself
-	if(joined_size==arow->item.size) {
-		joined_ptr=arow->item.ptr;
-		ai++; arow++;
-		if(ai==achunk->count) {
-			if(achunk=arow->link) {
-				ai=0;
-				arow=achunk->rows;
-			}
-		}
-	} else {
-		// join adjacent rows
-		char *ptr=(char *)pool.malloc(joined_size,13);
-		joined_ptr=ptr;
-		uint start_i=ai;
-		const Chunk::Row *start_row=arow;
-		const Chunk *chunk=achunk;
-		uint i;
-		const Chunk::Row *row;
-		do {
-			row=start_row;
-			for(i=start_i; i<chunk->count; i++, row++) {
-				if(row==append_here)
-					goto break22;
-				
-				if(row->item.lang==joined_lang) {
-					memcpy(ptr, row->item.ptr, row->item.size);
-					ptr+=row->item.size;
-				} else
-					goto break22;
-			}
-			if(chunk=row->link) {
-				start_i=0;
-				start_row=chunk->rows;
-			} else
-				break;
-		} while(true);
-break22:;
-		
-		// return joined rows
-		ai=i;
-		arow=row;
-		achunk=chunk;
-	}
-}
-
-String& String::reconstruct(Pool& pool) const {
-	//_asm int 3;
-	String& result=*new(pool) String(pool);
-	const Chunk *chunk=&head; 
-	const Chunk::Row *row=chunk->rows;
-	for(uint i=0; i<chunk->count; ) {
-		if(row==append_here)
-			break;
-
-		uchar joined_lang;
-		const char *joined_ptr;
-		size_t joined_size;
-#ifndef NO_STRING_ORIGIN
-		const char *joined_origin_file=row->item.origin.file;
-		const size_t joined_origin_line=row->item.origin.line;
-#endif
-		join_chain(pool, i, chunk, row,
-			joined_lang, joined_ptr, joined_size);
-
-		result.APPEND(joined_ptr, joined_size, joined_lang,
-			joined_origin_file, joined_origin_line);
-
-		if(!chunk)
-			break;
-	}
-
-	return result;
-};
+/// @test if in some piece were found no dict words, append it, not it's duplicate
+StringPtr String::replace(Pool& pool, Dictionary& dict) const {
+	StringPtr result(new String());
+	CharPtr lcstr(cstr());
+	const char *current=lcstr.get();
+
+	STRING_FOREACH_FRAGMENT(
+IFNDEF_NO_STRING_ORIGIN(
+		const char *joined_origin_file=fragment->origin.file;
+		const size_t joined_origin_line=fragment->origin.line;
+);
+		uchar joined_lang=fragment->lang;
+		const char *joined_ptr=current;
+		// calc size
+		size_t joined_size=0;
+		STRING_PREPARED_FOREACH_FRAGMENT(
+			if(fragment->lang==joined_lang)
+				joined_size+=fragment->size;
+			else
+				break; // before non-ours
+		);
+		current+=joined_size;
 
-String& String::replace_in_reconstructed(Pool& pool, Dictionary& dict) const {
-	//_asm int 3;
-	String& result=*new(pool) String(pool);
-	STRING_FOREACH_ROW(
-		const char *src=row->item.ptr; 
-		size_t src_size=row->item.size;
-		char *new_cstr=(char *)pool.malloc((size_t)ceil(src_size*dict.max_ratio()), 14);
+		// pointers are after joined piece
+		// & one step back, see STRING_PREPARED_FOREACH_FRAGMENT
+		--fragment;
+		
+		char *new_cstr=new(pool) char[(size_t)ceil(joined_size*dict.max_ratio())];
 		char *dest=new_cstr;
-		while(src_size) {
-			// there is a row where first column starts 'src'
-			if(Table::Item *item=dict.first_that_starts(src, src_size)) {
+		while(joined_size) {
+			// there is a fragment where first column starts 'joined_ptr'
+			if(Table::element_type row=dict.first_that_starts(joined_ptr, joined_size)) {
 				// get a=>b values
-				const String& a=*static_cast<Array *>(item)->get_string(0);
-				const String& b=*static_cast<Array *>(item)->get_string(1);
-				// skip 'a' in 'src' && reduce work size
-				src+=a.size();  src_size-=a.size();
+				ConstStringPtr a=row->get(0);
+				ConstStringPtr b=row->get(1);
+				// skip 'a' in 'joined_ptr' && reduce work size
+				joined_ptr+=a->size();  joined_size-=a->size();
 				// write 'b' to 'dest' && skip 'b' in 'dest'
-				b.store_to(dest);  dest+=b.size();
+				b->store_to(dest, String::UL_AS_IS);  dest+=b->size();
 			} else {
 				// write a char to b && reduce work size
-				*dest++=*src++;  src_size--;
+				*dest++=*joined_ptr++;  joined_size--;
 			}
 		}
 
-		result.APPEND(new_cstr, dest-new_cstr, 
-			row->item.lang,
-			row->item.origin.file, row->item.origin.line);
+		result->APPEND(new_cstr, dest-new_cstr, joined_lang,
+			joined_origin_file, joined_origin_line);
 	);
-break2:
+
 	return result;
 }
 
-String& String::replace(Pool& pool, Dictionary& dict) const {
-	return reconstruct(pool).replace_in_reconstructed(pool, dict);
+StringPtr String::join_chains(Pool& pool) const {
+	StringPtr result(new String());
+	
+	char *pooled_buf=new(pool) char[cstr_bufsize()];
+	store_to(pooled_buf, String::UL_AS_IS);
+	const char *current=pooled_buf;
+
+	STRING_FOREACH_FRAGMENT(
+IFNDEF_NO_STRING_ORIGIN(
+		const char *joined_origin_file=fragment->origin.file;
+		const size_t joined_origin_line=fragment->origin.line;
+);
+		uchar joined_lang=fragment->lang;
+		const char *joined_ptr=current;
+		// calc size
+		size_t joined_size=0;
+		STRING_PREPARED_FOREACH_FRAGMENT(
+			if(fragment->lang==joined_lang)
+				joined_size+=fragment->size;
+			else
+				break; // before non-ours
+		);
+		current+=joined_size;
+
+		// pointers are after joined piece
+		// & one step back, see STRING_PREPARED_FOREACH_FRAGMENT
+		--fragment;
+		
+		result->APPEND(joined_ptr, joined_size, joined_lang,
+			joined_origin_file, joined_origin_line);
+	);
+
+	return result;
 }
 
 double String::as_double() const { 
 	double result;
-	const char *cstr;
-	char buf[MAX_NUMBER];
-	if(head.rows+1==append_here) {
-		int size=min(head.rows[0].item.size, MAX_NUMBER-1);
-		memcpy(buf, head.rows[0].item.ptr, size);
-		buf[size]=0;
-		cstr=buf;
-	} else
-		cstr=this->cstr();
+	char buf[MAX_STRING];
+	if(size()>MAX_STRING-1)
+		throw Exception("number.format",
+			ConstStringPtr(this),
+			"invalid number too long a string (%u>%u)", size(), MAX_STRING-1);
+	char *eol=store_to(buf, String::UL_AS_IS); *eol=0;
+	const char *cstr=buf;
+
+	while(*cstr && isspace(*cstr))
+		cstr++;
+	if(!*cstr)
+		return 0;
+
 	char *error_pos;
 	// 0xABC
 	if(cstr[0]=='0')
@@ -820,24 +642,29 @@ double String::as_double() const {
 	else
 		result=(double)strtod(cstr, &error_pos);
 
-	if(*error_pos/*not EOS*/)
-		throw Exception(0, 0,
-			this,
-			"invalid number (double)");
+	while(char c=*error_pos++)
+		if(!isspace(c))
+			throw Exception("number.format",
+				ConstStringPtr(this),
+				"invalid number (double)");
 
 	return result;
 }
 int String::as_int() const { 
 	int result;
-	const char *cstr;
-	char buf[MAX_NUMBER];
-	if(head.rows+1==append_here) {
-		int size=min(head.rows[0].item.size, MAX_NUMBER-1);
-		memcpy(buf, head.rows[0].item.ptr, size);
-		buf[size]=0;
-		cstr=buf;
-	} else
-		cstr=this->cstr();
+	char buf[MAX_STRING];
+	if(size()>MAX_STRING-1)
+		throw Exception("number.format",
+			ConstStringPtr(this),
+			"invalid number too long a string (%u>%u)", size(), MAX_STRING-1);
+	char *eol=store_to(buf, String::UL_AS_IS); *eol=0;
+	const char *cstr=buf;
+
+	while(*cstr && isspace(*cstr))
+		cstr++;
+	if(!*cstr)
+		return 0;
+
 	char *error_pos;
 	// 0xABC
 	if(cstr[0]=='0')
@@ -848,70 +675,74 @@ int String::as_int() const {
 	else
 		result=(int)strtol(cstr, &error_pos, 0);
 
-	if(*error_pos/*not EOS*/)
-		throw Exception(0, 0,
-			this,
-			"invalid number (int)");
+	while(char c=*error_pos++)
+		if(!isspace(c))
+			throw Exception("number.format",
+				ConstStringPtr(this),
+				"invalid number (int)");
 
 	return result;
 }
 
-inline void ushort2uchars(ushort word, uchar& byte1, uchar& byte2) {
-	byte1=word&0xFF;
-	byte2=word>>8;
-}
-inline ushort uchars2ushort(uchar byte1, uchar byte2) {
-	return (byte2<<8) | byte1;
-}
-/* @todo maybe network order worth spending some effort?
-	don't bothering myself with network byte order,
-	am not planning to be able to move resulting file across platforms
-	for now
-*/
-void String::serialize(size_t prolog_size, void *& buf, size_t& buf_size) const {
+inline void uint2uchars(uint word, uchar *bytes) {
+	bytes[0]=word&0xFF;
+	bytes[1]=(word>>8)&0xFF;
+	bytes[2]=(word>>16)&0xFF;
+	bytes[3]=(word>>24)&0xFF;
+}
+inline uint uchars2uint(uchar *bytes) {
+	return bytes[3]<<24
+		| bytes[2]<<16
+		| bytes[1]<<8
+		| bytes[0];
+}
+
+void String::serialize(Pool& pool, size_t prolog_size, char *& buf, size_t& buf_size) const {
 	buf_size=
 		prolog_size
-		+used_rows()*(sizeof(uchar)+sizeof(ushort))
+		+fused*(sizeof(uchar)+sizeof(size_t))
 		+size();
-	buf=malloc(buf_size,15);
-	char *cur=(char *)buf+prolog_size;
+	buf=new(pool) char[buf_size];
+	char *cur=buf+prolog_size;
 
-	STRING_FOREACH_ROW(
+	STRING_FOREACH_FRAGMENT(
 		// lang
-		memcpy(cur, &row->item.lang, sizeof(uchar));
-		cur+=sizeof(uchar);
+		memcpy(cur, &fragment->lang, sizeof(fragment->lang));
+		cur+=sizeof(fragment->lang);
 		// size
-		uchar byte1; uchar byte2;
-		ushort2uchars(row->item.size, byte1, byte2);
-		memcpy(cur, &byte1, sizeof(uchar)); cur+=sizeof(uchar);
-		memcpy(cur, &byte2, sizeof(uchar)); cur+=sizeof(uchar);
+		// bug on some sparc platform [you can't work with integers on odd pointers]
+		// forces us to use byte array instead
+		uchar bytes[4];
+		uint2uchars(fragment->size, bytes);
+		memcpy(cur, &bytes, sizeof(bytes)); cur+=sizeof(bytes);
 		// bytes
-		memcpy(cur, row->item.ptr, row->item.size);
-		cur+=row->item.size;
+		memcpy(cur, fragment->ptr, fragment->size);
+		cur+=fragment->size;
 	);
-break2:
-	;
 }
-void String::deserialize(size_t prolog_size, void *buf, size_t buf_size, const char *file) {
+bool String::deserialize(size_t prolog_size, void *buf, size_t buf_size, const char *file) {
 	if(buf_size<=prolog_size)
-		return;
+		return false;
 
 	char *cur=(char *)buf+prolog_size;
 	buf_size-=prolog_size;
 
 	while(buf_size) {
-		uchar lang=*(uchar *)(cur);
-		
-		ushort size=uchars2ushort(
-			*(uchar*)(cur+sizeof(uchar)*1),
-			*(uchar*)(cur+sizeof(uchar)*2)
-		);
+		if(sizeof(uchar)+sizeof(size_t)>buf_size) // lang+size
+			return false;
+
+		uchar lang=*(uchar *)(cur);		
+		size_t size=uchars2uint((uchar *)cur);
+
+		size_t piece_size=sizeof(uchar)+sizeof(size_t)+size;
+		if(piece_size>buf_size) // buffer overrun, can be on incomplete cache files
+			return false;
 
-		const char *ptr=(const char*)(cur+sizeof(uchar)*3); 
+		const char *ptr=(const char*)(cur+sizeof(uchar)+sizeof(size_t)); 
 		APPEND(ptr, size, lang, file, 0);
 
-		size_t piece_size=sizeof(uchar)+sizeof(ushort)+size;
 		cur+=piece_size;
 		buf_size-=piece_size;
 	}
+	return true;
 }