Diff for /parser3/src/main/pa_string.C between versions 1.7 and 1.50

version 1.7, 2001/01/27 10:02:59 version 1.50, 2001/03/24 19:12:20
Line 1 Line 1
 /*  /** @file
   $Id$          Parser: string class. @see untaint.C.
   
           Copyright (c) 2001 ArtLebedev Group (http://www.artlebedev.com)
   
           Author: Alexander Petrosyan <paf@design.ru> (http://design.ru/paf)
   
           $Id$
 */  */
   
 #include <string.h>  #include "pa_config_includes.h"
   
 #include "pa_pool.h"  #include "pa_pool.h"
   #include "pa_string.h"
 #include "pa_hash.h"  #include "pa_hash.h"
   #include "pa_exception.h"
   
 void *String::operator new(size_t size, Pool *apool) {  // String
         return apool->malloc(size);  
 }  
   
 void String::construct(Pool *apool) {  String::String(Pool& apool, const char *src, bool tainted) :
         pool=apool;          Pooled(apool) {
         head.count=curr_chunk_rows=CR_PREALLOCATED_COUNT;          last_chunk=&head;
           head.count=CR_PREALLOCATED_COUNT;
         append_here=head.rows;          append_here=head.rows;
         head.preallocated_link=0;          head.preallocated_link=0;
         link_row=&head.rows[curr_chunk_rows];          link_row=&head.rows[head.count];
           fused_rows=fsize=0;
   
           if(src)
                   if(tainted)
                           APPEND_TAINTED(src, 0, 0, 0);
                   else
                           APPEND(src, 0, 0, 0);
 }  }
   
 void String::expand() {  void String::expand() {
         curr_chunk_rows=curr_chunk_rows*100/CR_GROW_PERCENT;          int new_chunk_count=last_chunk->count+last_chunk->count*CR_GROW_PERCENT/100;
         Chunk *chunk=static_cast<Chunk *>(          last_chunk=static_cast<Chunk *>(
                 pool->calloc(sizeof(Chunk::Row)*curr_chunk_rows+sizeof(Chunk *)));                  malloc(sizeof(int)+sizeof(Chunk::Row)*new_chunk_count+sizeof(Chunk *)));
         chunk->count=curr_chunk_rows;          last_chunk->count=new_chunk_count;
         link_row->link=chunk;          link_row->link=last_chunk;
         append_here=chunk->rows;          append_here=last_chunk->rows;
         link_row=&chunk->rows[curr_chunk_rows];          link_row=&last_chunk->rows[last_chunk->count];
 }          link_row->link=0;
   }
 String::String(String& src) {/*  
         int src_used_rows=src.used_rows(); {  String::String(const String& src) :     Pooled(src.pool()) {
                 curr_chunk_rows=src_total_rows          head.count=CR_PREALLOCATED_COUNT;
                         Chunk *chunk=static_cast<Chunk *>(          
                         pool->calloc(sizeof(Chunk::Row)*curr_chunk_rows+sizeof(Chunk *)));          int src_used_rows=src.fused_rows;
                 chunk->count=curr_chunk_rows;          if(src_used_rows<=head.count) {
                 link_row->link=chunk;                  // all new rows fit into preallocated area
                 append_here=chunk->rows;                  int curr_chunk_rows=head.count;
                 link_row=&chunk->rows[curr_chunk_rows];                  memcpy(head.rows, src.head.rows, sizeof(Chunk::Row)*src_used_rows);
                   append_here=&head.rows[src_used_rows];
                   link_row=&head.rows[curr_chunk_rows];
           } else {
                   // warning: 
                   //   heavily relies on the fact 
                   //   "preallocated area is the same for all strings"
                   //
                   // info:
                   //   allocating only enough mem to fit src string rows
                   //   next append would allocate a new chunk
                   //
                   // new rows don't fit into preallocated area: splitting into two chunks
                   // preallocated chunk src to constructing head
                   memcpy(head.rows, src.head.rows, sizeof(Chunk::Row)*head.count);
                   // remaining rows into new_chunk
                   int curr_chunk_rows=src_used_rows-head.count;
                   Chunk *new_chunk=static_cast<Chunk *>(
                           malloc(sizeof(int)+sizeof(Chunk::Row)*curr_chunk_rows+sizeof(Chunk *)));
                   new_chunk->count=curr_chunk_rows;
                   head.preallocated_link=new_chunk;
                   append_here=link_row=&new_chunk->rows[new_chunk->count];
   
                   Chunk *old_chunk=src.head.preallocated_link; 
                   Chunk::Row *new_rows=new_chunk->rows;
                   int rows_left_to_copy=new_chunk->count;
                   while(true) {
                           int old_count=old_chunk->count;
                           Chunk *next_chunk=old_chunk->rows[old_count].link;
                           if(next_chunk) {
                                   // not last source chunk
                                   // taking it all
                                   memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*old_count);
                                   new_rows+=old_count;
                                   rows_left_to_copy-=old_count;
   
                                   old_chunk=next_chunk;
                           } else {
                                   // the last source chunk
                                   // taking only those rows of chunk that _left_to_copy
                                   memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*rows_left_to_copy);
                                   break;
                           }
                   }
         }          }
           link_row->link=0;
           fused_rows=src_used_rows;
           fsize=src.fsize;
   }
   
   String& String::append(const String& src, Untaint_lang lang, bool forced) {
           int src_used_rows=src.fused_rows;
           int dst_free_rows=link_row-append_here;
           
           if(src_used_rows<=dst_free_rows) {
                   // all new rows fit into last chunk
                   memcpy(append_here, src.head.rows, sizeof(Chunk::Row)*src_used_rows);
                   set_lang(append_here, lang, forced, src_used_rows);
                   append_here+=src_used_rows;
           } else {
                   // not all new rows fit into last chunk: shrinking it to used part,
                   int used_rows=last_chunk->count-dst_free_rows;
                   //int *countp=append_here
                   link_row=&last_chunk->rows[last_chunk->count=used_rows];
                   //   allocating only enough mem to fit src string rows
                   //   next append would allocate a new chunk
                   last_chunk=static_cast<Chunk *>(
                           malloc(sizeof(int)+sizeof(Chunk::Row)*src_used_rows+sizeof(Chunk *)));
                   last_chunk->count=src_used_rows;
                   link_row->link=last_chunk;
                   append_here=link_row=&last_chunk->rows[src_used_rows];
   
                   const Chunk *old_chunk=&src.head; 
                   Chunk::Row *new_rows=last_chunk->rows;
                   int rows_left_to_copy=src_used_rows;
                   while(true) {
                           int old_count=old_chunk->count;
                           Chunk *next_chunk=old_chunk->rows[old_count].link;
                           if(next_chunk) {
                                   // not last source chunk
                                   // taking it all
                                   memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*old_count);
                                   set_lang(new_rows, lang, forced, old_count);
                                   new_rows+=old_count;
                                   rows_left_to_copy-=old_count;
   
                                   old_chunk=next_chunk;
                           } else {
                                   // the last source chunk
                                   // taking only those rows of chunk that _left_to_copy
                                   memcpy(new_rows, old_chunk->rows, sizeof(Chunk::Row)*rows_left_to_copy);
                                   set_lang(new_rows, lang, forced, rows_left_to_copy);
                                   break;
                           }
                   }
                   link_row->link=0;
           }
           fused_rows+=src_used_rows;
           fsize+=src.fsize;
   
         Chunk *chunk=&head;   
         do {  
                 result+=chunk->count;  
                 chunk=row->link;  
         } while(chunk);  
 break2:  
         return result;*/  
   
 }  
   
 String& String::operator = (String& src) {  
         return *this;          return *this;
 }  }
   void String::set_lang(Chunk::Row *row, Untaint_lang lang, bool forced, size_t size) {
           if(lang==UL_PASS_APPENDED)
 String& String::operator += (char *src) {                  return;
         if(chunk_is_full())  
                 expand();          while(size--) {
                   Untaint_lang& item_lang=(row++)->item.lang;
         append_here->item.ptr=src;                  if(item_lang==UL_YES || forced) // tainted? need untaint language assignment
         append_here->item.size=strlen(src);                          item_lang=lang;  // assign untaint language
         append_here++;          }
   
         return *this;  
 }  }
   
 size_t String::size() {  /*void String::change_lang(Untaint_lang lang) {
         int result=0;  
   
         Chunk *chunk=&head;           Chunk *chunk=&head; 
         do {          do {
                 Chunk::Row *row=chunk->rows;                  Chunk::Row *row=chunk->rows;
Line 76  size_t String::size() { Line 172  size_t String::size() {
                         if(row==append_here)                          if(row==append_here)
                                 goto break2;                                  goto break2;
   
                         result+=row->item.size;                          row->item.lang=lang;
                         row++;                          row++;
                 }                  }
                 chunk=row->link;                  chunk=row->link;
         } while(chunk);          } while(chunk);
 break2:  break2:
         return result;          return;
 }  }
   */
   String& String::real_append(STRING_APPEND_PARAMS) {
           if(!src)
                   return *this;
           if(!size)
                   size=strlen(src);
           if(!size)
                   return *this;
   
           if(chunk_is_full())
                   expand();
   
 char *String::c_str() {          append_here->item.ptr=src;
         char *result=static_cast<char *>(pool->malloc(size()+1));          fsize+=append_here->item.size=size;
           append_here->item.lang=tainted?UL_YES:UL_NO;
   #ifndef NO_STRING_ORIGIN
           append_here->item.origin.file=file;
           append_here->item.origin.line=line;
   #endif
           append_here++; fused_rows++;
   
         char *copy_here=result;          return *this;
         Chunk *chunk=&head;   }
   
   uint String::hash_code() const {
           uint result=0;
   
           const Chunk *chunk=&head; 
         do {          do {
                 Chunk::Row *row=chunk->rows;                  const Chunk::Row *row=chunk->rows;
                 for(int i=0; i<chunk->count; i++) {                  for(int i=0; i<chunk->count; i++) {
                         if(row==append_here)                          if(row==append_here)
                                 goto break2;                                  goto break2;
   
                         memcpy(copy_here, row->item.ptr, row->item.size);                          result=Hash::generic_code(result, row->item.ptr, row->item.size);
                         copy_here+=row->item.size;  
                         row++;                          row++;
                 }                  }
                 chunk=row->link;                  chunk=row->link;
         } while(chunk);          } while(chunk);
 break2:  break2:
         *copy_here=0;  
         return result;          return result;
 }  }
   
 int String::used_rows() {  int String::cmp(const String& src) const {
         int result=0;          const Chunk *a_chunk=&head;
           const Chunk *b_chunk=&src.head;
         Chunk *chunk=&head;           const Chunk::Row *a_row=a_chunk->rows;
         do {          const Chunk::Row *b_row=b_chunk->rows;
                 int count=chunk->count;          int a_offset=0;
                 result+=count;          int b_offset=0;
                 chunk=chunk->rows[count].link;          Chunk::Row *a_end=append_here;
         } while(chunk);          Chunk::Row *b_end=src.append_here;
           int a_countdown=a_chunk->count;
         result-=link_row-append_here;          int b_countdown=b_chunk->count;
           bool a_break=false;
           bool b_break=false;
           int result;
           while(true) {
                   a_break=a_row==a_end;
                   b_break=b_row==b_end;
                   if(a_break || b_break)
                           break;
   
                   int size_diff=
                           (a_row->item.size-a_offset)-
                           (b_row->item.size-b_offset);
   
                   if(size_diff==0) { // a has same size as b
                           result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, a_row->item.size-a_offset);
                           if(result)
                                   return result;
                           a_row++; a_countdown--; a_offset=0;
                           b_row++; b_countdown--; b_offset=0;
                   } else if (size_diff>0) { // a longer
                           result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, b_row->item.size-b_offset);
                           if(result)
                                   return result;
                           a_offset+=b_row->item.size-b_offset;
                           b_row++; b_countdown--; b_offset=0;
                   } else { // b longer
                           result=memcmp(a_row->item.ptr+a_offset, b_row->item.ptr+b_offset, a_row->item.size-a_offset);
                           if(result)
                                   return result;
                           b_offset+=a_row->item.size-a_offset;
                           a_row++; a_countdown--; a_offset=0;
                   }
   
                   if(!a_countdown) {
                           a_chunk=a_row->link;
                           a_row=a_chunk->rows;
                           a_countdown=a_chunk->count;
                   }
                   if(!b_countdown) {
                           b_chunk=b_row->link;
                           b_row=b_chunk->rows;
                           b_countdown=b_chunk->count;
                   }
           }
           if(a_break==b_break) // ended simultaneously
                   result=0;
           else if(a_break) // first bytes equal, but a ended before b
                   result=-1;
           else
                   result=+1;
         return result;          return result;
 }  }
   
 uint String::hash_code() {  int String::cmp(const char* b_ptr, int& partial, size_t src_size) const {
         uint result=0;          size_t b_size=src_size?src_size:b_ptr?strlen(b_ptr):0;
   
         Chunk *chunk=&head;           partial=0;
         do {          const Chunk *a_chunk=&head;
                 Chunk::Row *row=chunk->rows;          const Chunk::Row *a_row=a_chunk->rows;
                 for(int i=0; i<chunk->count; i++) {          int a_offset=0;
                         if(row==append_here)          int b_offset=0;
                                 goto break2;          Chunk::Row *a_end=append_here;
           int a_countdown=a_chunk->count;
                         result=Hash::generic_code(result, row->item.ptr, row->item.size);          bool a_break=false;
                         row++;          bool b_break=false;
           while(true) {
                   int size_diff=
                           (a_row->item.size-a_offset)-
                           (b_size-b_offset);
   
                   if(size_diff==0) { // a has same size as b
                           if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, a_row->item.size-a_offset)!=0)
                                   return result;
                           a_row++; a_countdown--; a_offset=0;
                           b_break=true;
                   } else if (size_diff>0) { // a longer
                           if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, b_size-b_offset)!=0)
                                   return result;
                           a_offset+=b_size-b_offset;
                           b_break=true;
                   } else { // b longer
                           if(int result=memcmp(a_row->item.ptr+a_offset, b_ptr+b_offset, a_row->item.size-a_offset)!=0)
                                   return result;
                           b_offset+=a_row->item.size-a_offset;
                           a_row++; a_countdown--; a_offset=0;
                 }                  }
                 chunk=row->link;  
         } while(chunk);  
 break2:  
         return result;  
 }  
   
 bool String::operator == (String& src) {                  a_break=a_row==a_end;
         return false;                  if(a_break || b_break)
                           break;
   
                   if(!a_countdown) {
                           a_chunk=a_row->link;
                           a_row=a_chunk->rows;
                           a_countdown=a_chunk->count;
                   }
           }
           if(a_break==b_break) // ended simultaneously
                   return 0;
           else if(a_break) // first bytes equal, but a ended before b
                   return partial=-1;
           else
                   return partial=+1;
   }
   
   #ifndef NO_STRING_ORIGIN
   const Origin& String::origin() const { 
           if(!fused_rows)
                   THROW(0, 0, 
                           0,
                           "String::origin() of empty string called");
           
           // determining origin by last appended piece
           // because first one frequently constant. 
           // ex: ^load[/file] "document_root" + "/file"
           return append_here[-1].item.origin; 
 }  }
   #endif

Removed from v.1.7  
changed lines
  Added in v.1.50


E-mail: