Annotation of parser3/src/main/pa_common.C, revision 1.54

1.15      paf         1: /** @file
1.16      paf         2:        Parser: commonly functions.
                      3: 
1.8       paf         4:        Copyright(c) 2001 ArtLebedev Group(http://www.artlebedev.com)
1.16      paf         5: 
1.8       paf         6:        Author: Alexander Petrosyan <paf@design.ru>(http://design.ru/paf)
1.5       paf         7: 
1.54    ! parser      8:        $Id: pa_common.C,v 1.53 2001/05/17 19:33:33 parser Exp $
1.1       paf         9: */
                     10: 
                     11: #include "pa_common.h"
1.2       paf        12: #include "pa_types.h"
1.4       paf        13: #include "pa_exception.h"
1.14      paf        14: #include "pa_pool.h"
                     15: #include "pa_globals.h"
                     16: #include "pa_value.h"
                     17: #include "pa_hash.h"
                     18: #include "pa_string.h"
1.1       paf        19: 
1.47      paf        20: #ifndef WIN32
                     21: #      ifndef _O_TEXT
                     22: #              define _O_TEXT 0
                     23: #      endif
                     24: #      ifndef _O_BINARY
                     25: #              define _O_BINARY 0
                     26: #      endif
                     27: #endif
                     28: 
1.22      paf        29: #if _MSC_VER
1.1       paf        30: 
                     31: int __vsnprintf(char *b, size_t s, const char *f, va_list l) {
                     32:        int r=_vsnprintf(b, --s, f, l);
                     33:        b[s]=0;
                     34:        return r;
                     35: }
                     36: int __snprintf(char *b, size_t s, const char *f, ...) {
                     37:        va_list l;
                     38:     va_start(l, f);
                     39:     int r=__vsnprintf(b, s, f, l);
                     40:     va_end(l);
                     41:        return r;
                     42: }
                     43: 
                     44: #endif
1.2       paf        45: 
1.18      paf        46: 
1.28      paf        47: char *file_read_text(Pool& pool, const String& file_spec, bool fail_on_read_problem) {
1.34      paf        48:        void *result;
                     49:        size_t size;
1.35      paf        50:        return file_read(pool, file_spec, result, size, true, 
                     51:                fail_on_read_problem)?(char *)result:0;
1.34      paf        52: }
                     53: bool file_read(Pool& pool, const String& file_spec, 
1.44      paf        54:                           void*& data, size_t& read_size, bool as_text,
                     55:                           bool fail_on_read_problem,
                     56:                           size_t offset, size_t limit) {
                     57:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
1.33      paf        58:        int f;
1.2       paf        59:     struct stat finfo;
1.33      paf        60: 
                     61:        // first open, next stat:
1.45      paf        62:        // directory update of NTFS hard links performed on open.
1.33      paf        63:        // ex: 
                     64:        //   a.html:^test[] and b.html hardlink to a.html
                     65:        //   user inserts ! before ^test in a.html
                     66:        //   directory entry of b.html in NTFS not updated at once,
1.35      paf        67:        //   they delay update till open, so we would receive "!^test[" string
                     68:        //   if would do stat, next open.
1.34      paf        69:     if(
                     70:                (f=open(fname, O_RDONLY|(as_text?_O_TEXT:_O_BINARY)))>=0 && 
                     71:                stat(fname, &finfo)==0) {
1.2       paf        72:                /*if(exclusive)
                     73:                        flock(f, LOCK_EX);*/
1.44      paf        74:                size_t max_size=limit?min(offset+limit, finfo.st_size)-offset:finfo.st_size;
1.47      paf        75:                if(!max_size) { // eof
                     76:                        data=0;
                     77:                        read_size=0;
                     78:                        return true;
                     79:                }
1.44      paf        80:                data=pool.malloc(max_size+(as_text?1:0));
1.45      paf        81:                if(offset)
                     82:                        lseek(f, offset, SEEK_SET);
1.44      paf        83:                read_size=read(f, data, max_size);
1.2       paf        84:                /*if(exclusive)
                     85:                        flock(f, LOCK_UN);*/
                     86:                close(f);
1.32      paf        87: 
1.44      paf        88:                if(read_size>=0 && read_size<=max_size) {
1.34      paf        89:                        if(as_text)
1.46      paf        90:                                ((char*&)data)[read_size]=0;
1.34      paf        91:                } else
1.33      paf        92:                        PTHROW(0, 0, 
                     93:                                &file_spec, 
1.44      paf        94:                                "read failed: actually read %d bytes count not in [0..%lu] valid range", 
                     95:                                        read_size, (unsigned long)max_size); //never
1.32      paf        96:                
1.34      paf        97:                return true;//prepare_config(result, remove_empty_lines);
1.2       paf        98:     }
1.4       paf        99:        if(fail_on_read_problem)
1.33      paf       100:                PTHROW(0, 0, 
                    101:                        &file_spec, 
1.54    ! parser    102:                        "read failed: %s (%d), actual filename '%s'", 
        !           103:                                strerror(errno), errno, fname);
1.34      paf       104:     return false;
1.8       paf       105: }
                    106: 
1.18      paf       107: void file_write(Pool& pool, 
1.28      paf       108:                                const String& file_spec, 
1.34      paf       109:                                const void *data, size_t size, 
1.33      paf       110:                                bool as_text/*, 
1.20      paf       111:                                bool exclusive*/) {
1.44      paf       112:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
1.28      paf       113:        int f;
1.50      paf       114:        if(access(fname, W_OK)!=0) {/*no*/
                    115:                size_t pos_after=1;
                    116:                int pos_before;
                    117:                while((pos_before=file_spec.pos("/", 1, pos_after))>=0) {
                    118:                        mkdir(file_spec.mid(0, pos_before).cstr(String::UL_FILE_NAME), 0775);
                    119:                        pos_after=pos_before+1;
                    120:                }
                    121: 
1.33      paf       122:                if((f=open(fname, O_WRONLY|O_CREAT|_O_BINARY, 0666))>0)
1.28      paf       123:                        close(f);
                    124:        }
                    125:        if(access(fname, R_OK|W_OK)==0) {
1.34      paf       126:                int mode=O_RDWR|(as_text?_O_TEXT:_O_BINARY)
1.18      paf       127: #ifdef WIN32
1.28      paf       128:                        |O_TRUNC
1.18      paf       129: #endif
1.28      paf       130:                ;
1.33      paf       131:                if((f=open(fname, mode, 0666))>=0) {
1.28      paf       132:                        /*if(exclusive)
                    133:                                flock(f, LOCK_EX);*/
                    134:                        
1.33      paf       135:                        if(size) write(f, data, size);
1.18      paf       136: #ifndef WIN32
1.33      paf       137:                        ftruncate(f, size);
1.18      paf       138: #endif
1.28      paf       139:                        /*if(exclusive)
                    140:                                flock(f, LOCK_UN);*/
                    141:                        close(f);
                    142:                        return;
1.18      paf       143:                }
                    144:        }
1.33      paf       145:        PTHROW(0, 0, 
                    146:                &file_spec, 
1.54    ! parser    147:                "write failed: %s (%d), actual filename '%s'", 
        !           148:                        strerror(errno), errno, fname);
1.30      paf       149: }
                    150: 
1.50      paf       151: static void rmdir(const String& file_spec, size_t pos_after) {
                    152:        int pos_before;
                    153:        if((pos_before=file_spec.pos("/", 1, pos_after))>=0)
                    154:                rmdir(file_spec, pos_before+1);
                    155:        
                    156:        rmdir(file_spec.mid(0, pos_after-1/* / */).cstr(String::UL_FILE_NAME));
                    157: }
1.30      paf       158: void file_delete(Pool& pool, const String& file_spec) {
1.54    ! parser    159:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
        !           160:        if(unlink(fname)!=0)
1.33      paf       161:                PTHROW(0, 0, 
                    162:                        &file_spec, 
1.54    ! parser    163:                        "unlink failed: %s (%d), actual filename '%s'", 
        !           164:                                strerror(errno), errno, fname);
1.50      paf       165: 
                    166:        rmdir(file_spec, 1);
1.31      paf       167: }
                    168: 
1.51      paf       169: 
                    170: static bool entry_readable(const String& file_spec, bool need_dir) {
                    171:     const char *fname=file_spec.cstr(String::UL_FILE_NAME);
                    172:        struct stat finfo;
                    173:        if(access(fname, R_OK)==0 && stat(fname, &finfo)==0) {
                    174:                bool is_dir=(bool)(finfo.st_mode&S_IFDIR);
                    175:                return is_dir==need_dir;
                    176:        }
                    177:        return false;
                    178: }
1.31      paf       179: bool file_readable(const String& file_spec) {
1.51      paf       180:        return entry_readable(file_spec, false);
                    181: }
                    182: bool dir_readable(const String& file_spec) {
                    183:        return entry_readable(file_spec, true);
1.43      paf       184: }
                    185: bool file_executable(const String& file_spec) {
                    186:     return access(file_spec.cstr(String::UL_FILE_NAME), X_OK)==0;
1.44      paf       187: }
                    188: 
                    189: size_t file_size(const String& file_spec) {
                    190:        Pool& pool=file_spec.pool();
                    191:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
                    192:     struct stat finfo;
                    193:        if(stat(fname, &finfo)!=0)
                    194:                PTHROW(0, 0, 
                    195:                        &file_spec, 
1.54    ! parser    196:                        "getting file size failed: %s (%d), real filename '%s'", 
        !           197:                                strerror(errno), errno, fname);
1.44      paf       198:        return finfo.st_size;
1.18      paf       199: }
                    200: 
1.8       paf       201: char *getrow(char **row_ref, char delim) {
                    202:     char *result=*row_ref;
                    203:     if(result) {
                    204:                *row_ref=strchr(result, delim);
                    205:                if(*row_ref) 
                    206:                        *((*row_ref)++)=0; 
                    207:                else if(!*result) 
                    208:                        return 0;
                    209:     }
                    210:     return result;
                    211: }
                    212: 
1.23      paf       213: char *lsplit(char *string, char delim) {
                    214:     if(string) {
                    215:                char *v=strchr(string, delim);
1.8       paf       216:                if(v) {
                    217:                        *v=0;
                    218:                        return v+1;
                    219:                }
                    220:     }
                    221:     return 0;
                    222: }
                    223: 
                    224: char *lsplit(char **string_ref, char delim) {
                    225:     char *result=*string_ref;
                    226:        char *next=lsplit(*string_ref, delim);
                    227:     *string_ref=next;
                    228:     return result;
1.9       paf       229: }
                    230: 
                    231: char *rsplit(char *string, char delim) {
1.18      paf       232:     if(string) {
1.9       paf       233:                char *v=strrchr(string, delim);
1.18      paf       234:                if(v) {
1.9       paf       235:                        *v=0;
                    236:                        return v+1;
                    237:                }
                    238:     }
                    239:     return NULL;       
1.10      paf       240: }
                    241: 
1.37      paf       242: /// @todo less stupid type detection
1.10      paf       243: char *format(Pool& pool, double value, char *fmt) {
                    244:        char *result=(char *)pool.malloc(MAX_NUMBER);
                    245:        if(fmt)
                    246:                if(strpbrk(fmt, "diouxX"))
                    247:                        if(strpbrk(fmt, "ouxX"))
1.33      paf       248:                                snprintf(result, MAX_NUMBER, fmt, (uint)value );
1.10      paf       249:                        else
1.33      paf       250:                                snprintf(result, MAX_NUMBER, fmt, (int)value );
1.10      paf       251:                else
                    252:                        snprintf(result, MAX_NUMBER, fmt, value);
                    253:        else
1.33      paf       254:                snprintf(result, MAX_NUMBER, "%d", (int)value);
1.10      paf       255:        
                    256:        return result;
1.12      paf       257: }
                    258: 
1.36      paf       259: size_t stdout_write(const void *buf, size_t size) {
1.12      paf       260: #ifdef WIN32
                    261:        do{
                    262:                int chunk_written=fwrite(buf, 1, min(8*0x400, size), stdout);
                    263:                if(chunk_written<=0)
                    264:                        break;
                    265:                size-=chunk_written;
1.36      paf       266:                buf=((const char*)buf)+chunk_written;
1.12      paf       267:        } while(size>0);
                    268: 
                    269:        return size;
                    270: #else
1.13      paf       271:        return fwrite(buf, 1, size, stdout);
1.12      paf       272: #endif
1.2       paf       273: }
1.14      paf       274: 
                    275: const char *unescape_chars(Pool& pool, const char *cp, int len) {
                    276:        char *s=(char *)pool.malloc(len + 1);
                    277:        enum EscapeState {
1.33      paf       278:                EscapeRest, 
                    279:                EscapeFirst, 
1.14      paf       280:                EscapeSecond
                    281:        } escapeState=EscapeRest;
                    282:        int escapedValue=0;
                    283:        int srcPos=0;
                    284:        int dstPos=0;
                    285:        while(srcPos < len) {
                    286:                int ch=cp[srcPos];
                    287:                switch(escapeState) {
                    288:                        case EscapeRest:
                    289:                        if(ch=='%') {
                    290:                                escapeState=EscapeFirst;
                    291:                        } else if(ch=='+') {
                    292:                                s[dstPos++]=' ';
                    293:                        } else {
                    294:                                s[dstPos++]=ch; 
                    295:                        }
                    296:                        break;
                    297:                        case EscapeFirst:
                    298:                        escapedValue=hex_value[ch] << 4;        
                    299:                        escapeState=EscapeSecond;
                    300:                        break;
                    301:                        case EscapeSecond:
                    302:                        escapedValue +=hex_value[ch];
                    303:                        s[dstPos++]=escapedValue;
                    304:                        escapeState=EscapeRest;
                    305:                        break;
                    306:                }
                    307:                srcPos++;
                    308:        }
                    309:        s[dstPos]=0;
                    310:        return s;
                    311: }
                    312: 
1.52      paf       313: /// used by attributed_meaning_to_string / append_attribute_subattribute
1.40      paf       314: struct Attributed_meaning_info {
1.52      paf       315:        String *header; // header line being constructed
                    316:        String::Untaint_lang lang; // language in which to append to that line
1.40      paf       317: };
1.17      paf       318: static void append_attribute_subattribute(const Hash::Key& akey, Hash::Val *avalue, 
1.14      paf       319:                                                                                  void *info) {
                    320:        if(akey==VALUE_NAME)
                    321:                return;
                    322: 
1.40      paf       323:        Attributed_meaning_info& ami=*static_cast<Attributed_meaning_info *>(info);
                    324: 
1.14      paf       325:        // ...; charset=windows1251
1.48      paf       326:        *ami.header << "; ";
1.40      paf       327:        ami.header->append(akey, ami.lang, true);
1.48      paf       328:        *ami.header << "=";
                    329:        ami.header->append(static_cast<Value *>(avalue)->as_string(), ami.lang, true);
1.14      paf       330: }
1.49      paf       331: const String& attributed_meaning_to_string(Value& meaning, 
                    332:                                                                                   String::Untaint_lang lang) {
1.20      paf       333:        String &result=*new(meaning.pool()) String(meaning.pool());
                    334:        if(Hash *hash=meaning.get_hash()) {
1.14      paf       335:                // $value(value) $subattribute(subattribute value)
                    336:                if(Value *value=static_cast<Value *>(hash->get(*value_name)))
1.40      paf       337:                        result.append(value->as_string(), lang, true);
1.14      paf       338: 
1.40      paf       339:                Attributed_meaning_info attributed_meaning_info={
1.52      paf       340:                        &result,
                    341:                        lang
1.40      paf       342:                };
                    343:                hash->for_each(append_attribute_subattribute, &attributed_meaning_info);
1.14      paf       344:        } else // result value
1.40      paf       345:                result.append(meaning.as_string(), lang, true);
1.14      paf       346: 
                    347:        return result;
1.24      paf       348: }
                    349: 
                    350: #ifdef WIN32
                    351: void back_slashes_to_slashes(char *s) {
                    352:        if(s)
                    353:                for(; *s; s++)
                    354:                        if(*s=='\\')
                    355:                                *s='/';
                    356: }
1.42      paf       357: /*
                    358: void slashes_to_back_slashes(char *s) {
                    359:        if(s)
                    360:                for(; *s; s++)
                    361:                        if(*s=='/')
                    362:                                *s='\\';
                    363: }
                    364: */
1.24      paf       365: #endif
1.41      paf       366: 
                    367: bool StrEqNc(const char *s1, const char *s2, bool strict) {
                    368:        while(true) {
                    369:                if(!(*s1)) {
                    370:                        if(!(*s2))
                    371:                                return true;
                    372:                        else
                    373:                                return !strict;
                    374:                } else if(!(*s2))
                    375:                        return !strict;
                    376:                if(isalpha(*s1)) {
                    377:                        if(tolower(*s1) !=tolower(*s2))
                    378:                                return false;
                    379:                } else if((*s1) !=(*s2))
                    380:                        return false;
                    381:                s1++;
                    382:                s2++;
                    383:        }
1.48      paf       384: }
                    385: 
                    386: char *unquote(char*& current, char stop_at) {
                    387:        char *result=current;
                    388:        char *dest=current;
                    389:        // skip leading WS
                    390:        while(*current==' ' || *current=='\t')
                    391:                current++;
                    392:        if(!*current)
                    393:                return current=0;
                    394: 
                    395:        bool quoted=*current=='"';
                    396:        if(quoted)
                    397:                current++;
                    398: 
                    399:        for(; *current; ) {
                    400:                if(quoted)
                    401:                        switch(*current) {
                    402:                        case '\\': // "...\c
                    403:                                if(current[1])
                    404:                                        current++;
                    405:                                break;
                    406:                        case '"':
                    407:                                current++;
                    408:                                goto break2;
                    409:                        }
                    410:                else
                    411:                        if(*current==stop_at)
                    412:                                break;
                    413: 
                    414:                *dest++=*current++;
                    415:        }
                    416: break2:
                    417:        if(*current)
                    418:                current++; // skip 'stop_at'
                    419:        *dest=0;
                    420:        return result;
1.41      paf       421: }

E-mail: