Annotation of parser3/src/main/pa_common.C, revision 1.58

1.15      paf         1: /** @file
1.16      paf         2:        Parser: commonly functions.
                      3: 
1.8       paf         4:        Copyright(c) 2001 ArtLebedev Group(http://www.artlebedev.com)
1.16      paf         5: 
1.8       paf         6:        Author: Alexander Petrosyan <paf@design.ru>(http://design.ru/paf)
1.1       paf         7: */
1.58    ! parser      8: static const char *RCSId="$Id: pa_common.C,v 1.57 2001/07/07 17:59:02 parser Exp $"; 
1.1       paf         9: 
                     10: #include "pa_common.h"
1.2       paf        11: #include "pa_types.h"
1.4       paf        12: #include "pa_exception.h"
1.14      paf        13: #include "pa_pool.h"
                     14: #include "pa_globals.h"
                     15: #include "pa_value.h"
                     16: #include "pa_hash.h"
                     17: #include "pa_string.h"
1.1       paf        18: 
1.47      paf        19: #ifndef WIN32
                     20: #      ifndef _O_TEXT
                     21: #              define _O_TEXT 0
                     22: #      endif
                     23: #      ifndef _O_BINARY
                     24: #              define _O_BINARY 0
                     25: #      endif
                     26: #endif
                     27: 
1.22      paf        28: #if _MSC_VER
1.1       paf        29: 
                     30: int __vsnprintf(char *b, size_t s, const char *f, va_list l) {
                     31:        int r=_vsnprintf(b, --s, f, l);
                     32:        b[s]=0;
                     33:        return r;
                     34: }
                     35: int __snprintf(char *b, size_t s, const char *f, ...) {
                     36:        va_list l;
                     37:     va_start(l, f);
                     38:     int r=__vsnprintf(b, s, f, l);
                     39:     va_end(l);
                     40:        return r;
                     41: }
                     42: 
                     43: #endif
1.2       paf        44: 
1.18      paf        45: 
1.28      paf        46: char *file_read_text(Pool& pool, const String& file_spec, bool fail_on_read_problem) {
1.34      paf        47:        void *result;
                     48:        size_t size;
1.35      paf        49:        return file_read(pool, file_spec, result, size, true, 
                     50:                fail_on_read_problem)?(char *)result:0;
1.34      paf        51: }
                     52: bool file_read(Pool& pool, const String& file_spec, 
1.44      paf        53:                           void*& data, size_t& read_size, bool as_text,
                     54:                           bool fail_on_read_problem,
                     55:                           size_t offset, size_t limit) {
                     56:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
1.33      paf        57:        int f;
1.2       paf        58:     struct stat finfo;
1.33      paf        59: 
                     60:        // first open, next stat:
1.45      paf        61:        // directory update of NTFS hard links performed on open.
1.33      paf        62:        // ex: 
                     63:        //   a.html:^test[] and b.html hardlink to a.html
                     64:        //   user inserts ! before ^test in a.html
                     65:        //   directory entry of b.html in NTFS not updated at once,
1.35      paf        66:        //   they delay update till open, so we would receive "!^test[" string
                     67:        //   if would do stat, next open.
1.34      paf        68:     if(
                     69:                (f=open(fname, O_RDONLY|(as_text?_O_TEXT:_O_BINARY)))>=0 && 
                     70:                stat(fname, &finfo)==0) {
1.2       paf        71:                /*if(exclusive)
                     72:                        flock(f, LOCK_EX);*/
1.44      paf        73:                size_t max_size=limit?min(offset+limit, finfo.st_size)-offset:finfo.st_size;
1.47      paf        74:                if(!max_size) { // eof
                     75:                        data=0;
                     76:                        read_size=0;
                     77:                        return true;
                     78:                }
1.44      paf        79:                data=pool.malloc(max_size+(as_text?1:0));
1.45      paf        80:                if(offset)
                     81:                        lseek(f, offset, SEEK_SET);
1.44      paf        82:                read_size=read(f, data, max_size);
1.2       paf        83:                /*if(exclusive)
                     84:                        flock(f, LOCK_UN);*/
                     85:                close(f);
1.32      paf        86: 
1.44      paf        87:                if(read_size>=0 && read_size<=max_size) {
1.34      paf        88:                        if(as_text)
1.46      paf        89:                                ((char*&)data)[read_size]=0;
1.34      paf        90:                } else
1.33      paf        91:                        PTHROW(0, 0, 
                     92:                                &file_spec, 
1.44      paf        93:                                "read failed: actually read %d bytes count not in [0..%lu] valid range", 
                     94:                                        read_size, (unsigned long)max_size); //never
1.32      paf        95:                
1.34      paf        96:                return true;//prepare_config(result, remove_empty_lines);
1.2       paf        97:     }
1.4       paf        98:        if(fail_on_read_problem)
1.33      paf        99:                PTHROW(0, 0, 
                    100:                        &file_spec, 
1.54      parser    101:                        "read failed: %s (%d), actual filename '%s'", 
                    102:                                strerror(errno), errno, fname);
1.34      paf       103:     return false;
1.8       paf       104: }
                    105: 
1.18      paf       106: void file_write(Pool& pool, 
1.28      paf       107:                                const String& file_spec, 
1.34      paf       108:                                const void *data, size_t size, 
1.33      paf       109:                                bool as_text/*, 
1.20      paf       110:                                bool exclusive*/) {
1.44      paf       111:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
1.28      paf       112:        int f;
1.50      paf       113:        if(access(fname, W_OK)!=0) {/*no*/
                    114:                size_t pos_after=1;
                    115:                int pos_before;
                    116:                while((pos_before=file_spec.pos("/", 1, pos_after))>=0) {
                    117:                        mkdir(file_spec.mid(0, pos_before).cstr(String::UL_FILE_NAME), 0775);
                    118:                        pos_after=pos_before+1;
                    119:                }
                    120: 
1.33      paf       121:                if((f=open(fname, O_WRONLY|O_CREAT|_O_BINARY, 0666))>0)
1.28      paf       122:                        close(f);
                    123:        }
                    124:        if(access(fname, R_OK|W_OK)==0) {
1.34      paf       125:                int mode=O_RDWR|(as_text?_O_TEXT:_O_BINARY)
1.18      paf       126: #ifdef WIN32
1.28      paf       127:                        |O_TRUNC
1.18      paf       128: #endif
1.28      paf       129:                ;
1.33      paf       130:                if((f=open(fname, mode, 0666))>=0) {
1.28      paf       131:                        /*if(exclusive)
                    132:                                flock(f, LOCK_EX);*/
                    133:                        
1.33      paf       134:                        if(size) write(f, data, size);
1.18      paf       135: #ifndef WIN32
1.33      paf       136:                        ftruncate(f, size);
1.18      paf       137: #endif
1.28      paf       138:                        /*if(exclusive)
                    139:                                flock(f, LOCK_UN);*/
                    140:                        close(f);
                    141:                        return;
1.18      paf       142:                }
                    143:        }
1.33      paf       144:        PTHROW(0, 0, 
                    145:                &file_spec, 
1.54      parser    146:                "write failed: %s (%d), actual filename '%s'", 
                    147:                        strerror(errno), errno, fname);
1.30      paf       148: }
                    149: 
1.50      paf       150: static void rmdir(const String& file_spec, size_t pos_after) {
                    151:        int pos_before;
                    152:        if((pos_before=file_spec.pos("/", 1, pos_after))>=0)
                    153:                rmdir(file_spec, pos_before+1);
                    154:        
                    155:        rmdir(file_spec.mid(0, pos_after-1/* / */).cstr(String::UL_FILE_NAME));
                    156: }
1.30      paf       157: void file_delete(Pool& pool, const String& file_spec) {
1.54      parser    158:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
                    159:        if(unlink(fname)!=0)
1.33      paf       160:                PTHROW(0, 0, 
                    161:                        &file_spec, 
1.54      parser    162:                        "unlink failed: %s (%d), actual filename '%s'", 
                    163:                                strerror(errno), errno, fname);
1.50      paf       164: 
                    165:        rmdir(file_spec, 1);
1.31      paf       166: }
                    167: 
1.51      paf       168: 
                    169: static bool entry_readable(const String& file_spec, bool need_dir) {
                    170:     const char *fname=file_spec.cstr(String::UL_FILE_NAME);
                    171:        struct stat finfo;
                    172:        if(access(fname, R_OK)==0 && stat(fname, &finfo)==0) {
                    173:                bool is_dir=(bool)(finfo.st_mode&S_IFDIR);
                    174:                return is_dir==need_dir;
                    175:        }
                    176:        return false;
                    177: }
1.31      paf       178: bool file_readable(const String& file_spec) {
1.51      paf       179:        return entry_readable(file_spec, false);
                    180: }
                    181: bool dir_readable(const String& file_spec) {
                    182:        return entry_readable(file_spec, true);
1.43      paf       183: }
                    184: bool file_executable(const String& file_spec) {
                    185:     return access(file_spec.cstr(String::UL_FILE_NAME), X_OK)==0;
1.44      paf       186: }
                    187: 
1.58    ! parser    188: void file_stat(const String& file_spec, 
        !           189:                           size_t& rsize, 
        !           190:                           time_t& ratime,
        !           191:                           time_t& rmtime,
        !           192:                           time_t& rctime) {
1.44      paf       193:        Pool& pool=file_spec.pool();
                    194:        const char *fname=file_spec.cstr(String::UL_FILE_NAME);
                    195:     struct stat finfo;
                    196:        if(stat(fname, &finfo)!=0)
                    197:                PTHROW(0, 0, 
                    198:                        &file_spec, 
1.54      parser    199:                        "getting file size failed: %s (%d), real filename '%s'", 
                    200:                                strerror(errno), errno, fname);
1.58    ! parser    201:        rsize=finfo.st_size;
        !           202:        ratime=finfo.st_atime;
        !           203:        rmtime=finfo.st_mtime;
        !           204:        rctime=finfo.st_ctime;
1.18      paf       205: }
                    206: 
1.8       paf       207: char *getrow(char **row_ref, char delim) {
                    208:     char *result=*row_ref;
                    209:     if(result) {
                    210:                *row_ref=strchr(result, delim);
                    211:                if(*row_ref) 
                    212:                        *((*row_ref)++)=0; 
                    213:                else if(!*result) 
                    214:                        return 0;
                    215:     }
                    216:     return result;
                    217: }
                    218: 
1.23      paf       219: char *lsplit(char *string, char delim) {
                    220:     if(string) {
                    221:                char *v=strchr(string, delim);
1.8       paf       222:                if(v) {
                    223:                        *v=0;
                    224:                        return v+1;
                    225:                }
                    226:     }
                    227:     return 0;
                    228: }
                    229: 
                    230: char *lsplit(char **string_ref, char delim) {
                    231:     char *result=*string_ref;
                    232:        char *next=lsplit(*string_ref, delim);
                    233:     *string_ref=next;
                    234:     return result;
1.9       paf       235: }
                    236: 
                    237: char *rsplit(char *string, char delim) {
1.18      paf       238:     if(string) {
1.9       paf       239:                char *v=strrchr(string, delim);
1.18      paf       240:                if(v) {
1.9       paf       241:                        *v=0;
                    242:                        return v+1;
                    243:                }
                    244:     }
                    245:     return NULL;       
1.10      paf       246: }
                    247: 
1.37      paf       248: /// @todo less stupid type detection
1.10      paf       249: char *format(Pool& pool, double value, char *fmt) {
                    250:        char *result=(char *)pool.malloc(MAX_NUMBER);
                    251:        if(fmt)
                    252:                if(strpbrk(fmt, "diouxX"))
                    253:                        if(strpbrk(fmt, "ouxX"))
1.33      paf       254:                                snprintf(result, MAX_NUMBER, fmt, (uint)value );
1.10      paf       255:                        else
1.33      paf       256:                                snprintf(result, MAX_NUMBER, fmt, (int)value );
1.10      paf       257:                else
                    258:                        snprintf(result, MAX_NUMBER, fmt, value);
                    259:        else
1.33      paf       260:                snprintf(result, MAX_NUMBER, "%d", (int)value);
1.10      paf       261:        
                    262:        return result;
1.12      paf       263: }
                    264: 
1.36      paf       265: size_t stdout_write(const void *buf, size_t size) {
1.12      paf       266: #ifdef WIN32
                    267:        do{
                    268:                int chunk_written=fwrite(buf, 1, min(8*0x400, size), stdout);
                    269:                if(chunk_written<=0)
                    270:                        break;
                    271:                size-=chunk_written;
1.36      paf       272:                buf=((const char*)buf)+chunk_written;
1.12      paf       273:        } while(size>0);
                    274: 
                    275:        return size;
                    276: #else
1.13      paf       277:        return fwrite(buf, 1, size, stdout);
1.12      paf       278: #endif
1.2       paf       279: }
1.14      paf       280: 
                    281: const char *unescape_chars(Pool& pool, const char *cp, int len) {
                    282:        char *s=(char *)pool.malloc(len + 1);
                    283:        enum EscapeState {
1.33      paf       284:                EscapeRest, 
                    285:                EscapeFirst, 
1.14      paf       286:                EscapeSecond
                    287:        } escapeState=EscapeRest;
                    288:        int escapedValue=0;
                    289:        int srcPos=0;
                    290:        int dstPos=0;
                    291:        while(srcPos < len) {
                    292:                int ch=cp[srcPos];
                    293:                switch(escapeState) {
                    294:                        case EscapeRest:
                    295:                        if(ch=='%') {
                    296:                                escapeState=EscapeFirst;
                    297:                        } else if(ch=='+') {
                    298:                                s[dstPos++]=' ';
                    299:                        } else {
                    300:                                s[dstPos++]=ch; 
                    301:                        }
                    302:                        break;
                    303:                        case EscapeFirst:
                    304:                        escapedValue=hex_value[ch] << 4;        
                    305:                        escapeState=EscapeSecond;
                    306:                        break;
                    307:                        case EscapeSecond:
                    308:                        escapedValue +=hex_value[ch];
                    309:                        s[dstPos++]=escapedValue;
                    310:                        escapeState=EscapeRest;
                    311:                        break;
                    312:                }
                    313:                srcPos++;
                    314:        }
                    315:        s[dstPos]=0;
                    316:        return s;
                    317: }
                    318: 
1.52      paf       319: /// used by attributed_meaning_to_string / append_attribute_subattribute
1.40      paf       320: struct Attributed_meaning_info {
1.52      paf       321:        String *header; // header line being constructed
                    322:        String::Untaint_lang lang; // language in which to append to that line
1.40      paf       323: };
1.17      paf       324: static void append_attribute_subattribute(const Hash::Key& akey, Hash::Val *avalue, 
1.14      paf       325:                                                                                  void *info) {
                    326:        if(akey==VALUE_NAME)
                    327:                return;
                    328: 
1.40      paf       329:        Attributed_meaning_info& ami=*static_cast<Attributed_meaning_info *>(info);
                    330: 
1.14      paf       331:        // ...; charset=windows1251
1.48      paf       332:        *ami.header << "; ";
1.40      paf       333:        ami.header->append(akey, ami.lang, true);
1.48      paf       334:        *ami.header << "=";
                    335:        ami.header->append(static_cast<Value *>(avalue)->as_string(), ami.lang, true);
1.14      paf       336: }
1.49      paf       337: const String& attributed_meaning_to_string(Value& meaning, 
                    338:                                                                                   String::Untaint_lang lang) {
1.20      paf       339:        String &result=*new(meaning.pool()) String(meaning.pool());
                    340:        if(Hash *hash=meaning.get_hash()) {
1.14      paf       341:                // $value(value) $subattribute(subattribute value)
                    342:                if(Value *value=static_cast<Value *>(hash->get(*value_name)))
1.40      paf       343:                        result.append(value->as_string(), lang, true);
1.14      paf       344: 
1.40      paf       345:                Attributed_meaning_info attributed_meaning_info={
1.52      paf       346:                        &result,
                    347:                        lang
1.40      paf       348:                };
                    349:                hash->for_each(append_attribute_subattribute, &attributed_meaning_info);
1.14      paf       350:        } else // result value
1.40      paf       351:                result.append(meaning.as_string(), lang, true);
1.14      paf       352: 
                    353:        return result;
1.24      paf       354: }
                    355: 
                    356: #ifdef WIN32
                    357: void back_slashes_to_slashes(char *s) {
                    358:        if(s)
                    359:                for(; *s; s++)
                    360:                        if(*s=='\\')
                    361:                                *s='/';
                    362: }
1.42      paf       363: /*
                    364: void slashes_to_back_slashes(char *s) {
                    365:        if(s)
                    366:                for(; *s; s++)
                    367:                        if(*s=='/')
                    368:                                *s='\\';
                    369: }
                    370: */
1.24      paf       371: #endif
1.41      paf       372: 
                    373: bool StrEqNc(const char *s1, const char *s2, bool strict) {
                    374:        while(true) {
                    375:                if(!(*s1)) {
                    376:                        if(!(*s2))
                    377:                                return true;
                    378:                        else
                    379:                                return !strict;
                    380:                } else if(!(*s2))
                    381:                        return !strict;
                    382:                if(isalpha(*s1)) {
                    383:                        if(tolower(*s1) !=tolower(*s2))
                    384:                                return false;
                    385:                } else if((*s1) !=(*s2))
                    386:                        return false;
                    387:                s1++;
                    388:                s2++;
                    389:        }
1.48      paf       390: }
                    391: 
                    392: char *unquote(char*& current, char stop_at) {
                    393:        char *result=current;
                    394:        char *dest=current;
                    395:        // skip leading WS
                    396:        while(*current==' ' || *current=='\t')
                    397:                current++;
                    398:        if(!*current)
                    399:                return current=0;
                    400: 
                    401:        bool quoted=*current=='"';
                    402:        if(quoted)
                    403:                current++;
                    404: 
                    405:        for(; *current; ) {
                    406:                if(quoted)
                    407:                        switch(*current) {
                    408:                        case '\\': // "...\c
                    409:                                if(current[1])
                    410:                                        current++;
                    411:                                break;
                    412:                        case '"':
                    413:                                current++;
                    414:                                goto break2;
                    415:                        }
                    416:                else
                    417:                        if(*current==stop_at)
                    418:                                break;
                    419: 
                    420:                *dest++=*current++;
                    421:        }
                    422: break2:
                    423:        if(*current)
                    424:                current++; // skip 'stop_at'
                    425:        *dest=0;
                    426:        return result;
1.57      parser    427: }
                    428: 
                    429: static int isLeap(int year) {
                    430:     return !(
                    431:              (year % 4) || ((year % 400) && !(year % 100))
                    432:             );
                    433: }
                    434: 
                    435: int getMonthDays(int year, int month) {
                    436:     int monthDays[]={
                    437:         31,
                    438:         isLeap(year) ? 29 : 28,
                    439:         31,
                    440:         30,
                    441:         31,
                    442:         30,
                    443:         31,
                    444:         31,
                    445:         30,
                    446:         31,
                    447:         30,
                    448:         31
                    449:     };
                    450:     return monthDays[month];
1.41      paf       451: }

E-mail: