Annotation of parser3/src/classes/file.C, revision 1.147

1.17      paf         1: /** @file
                      2:        Parser: @b file parser class.
                      3: 
1.136     paf         4:        Copyright (c) 2001-2005 ArtLebedev Group (http://www.artlebedev.com)
1.72      paf         5:        Author: Alexandr Petrosian <paf@design.ru> (http://paf.design.ru)
1.91      paf         6: */
1.17      paf         7: 
1.147   ! misha       8: static const char * const IDENT_FILE_C="$Date: 2006/11/13 13:45:57 $";
1.47      parser      9: 
                     10: #include "pa_config_includes.h"
                     11: 
                     12: #include "pcre.h"
1.1       paf        13: 
1.35      paf        14: #include "classes.h"
1.111     paf        15: #include "pa_vmethod_frame.h"
                     16: 
1.1       paf        17: #include "pa_request.h"
                     18: #include "pa_vfile.h"
1.11      paf        19: #include "pa_table.h"
1.21      paf        20: #include "pa_vint.h"
1.24      paf        21: #include "pa_exec.h"
1.40      parser     22: #include "pa_vdate.h"
1.47      parser     23: #include "pa_dir.h"
                     24: #include "pa_vtable.h"
1.67      paf        25: #include "pa_charset.h"
1.109     paf        26: #include "pa_charsets.h"
1.121     paf        27: #include "pa_sql_connection.h"
1.147   ! misha      28: #include "pa_md5.h"
1.1       paf        29: 
1.32      paf        30: // defines
                     31: 
1.48      parser     32: #define TEXT_MODE_NAME "text"
1.125     paf        33: #define BINARY_MODE_NAME "binary"
1.90      paf        34: #define STDIN_EXEC_PARAM_NAME "stdin"
1.109     paf        35: #define CHARSET_EXEC_PARAM_NAME "charset"
1.48      parser     36: 
1.131     paf        37: #define NAME_NAME "name"
                     38: 
1.132     paf        39: // externs
                     40: 
                     41: extern String sql_limit_name;
                     42: extern String sql_offset_name;
                     43: 
1.111     paf        44: // class
                     45: 
                     46: class MFile: public Methoded {
                     47: public: // VStateless_class
                     48:        
1.134     paf        49:        Value* create_new_value(Pool&, HashStringValue&) { return new VFile(); }
1.111     paf        50: 
                     51: public: // Methoded
                     52:        bool used_directly() { return true; }
                     53: 
                     54: public:
                     55:        MFile();
                     56: 
                     57: };
                     58: 
                     59: // global variable
                     60: 
                     61: DECLARE_CLASS_VAR(file, new MFile, 0);
                     62: 
1.83      paf        63: // consts
                     64: 
                     65: /// from apache-1.3|src|support|suexec.c 
1.111     paf        66: static const char* suexec_safe_env_lst[]={
1.83      paf        67:     "AUTH_TYPE",
                     68:     "CONTENT_LENGTH",
                     69:     "CONTENT_TYPE",
                     70:     "DATE_GMT",
                     71:     "DATE_LOCAL",
                     72:     "DOCUMENT_NAME",
                     73:     "DOCUMENT_PATH_INFO",
                     74:     "DOCUMENT_ROOT",
                     75:     "DOCUMENT_URI",
                     76:     "FILEPATH_INFO",
                     77:     "GATEWAY_INTERFACE",
                     78:     "LAST_MODIFIED",
                     79:     "PATH_INFO",
                     80:     "PATH_TRANSLATED",
                     81:     "QUERY_STRING",
                     82:     "QUERY_STRING_UNESCAPED",
                     83:     "REMOTE_ADDR",
                     84:     "REMOTE_HOST",
                     85:     "REMOTE_IDENT",
                     86:     "REMOTE_PORT",
                     87:     "REMOTE_USER",
                     88:     "REDIRECT_QUERY_STRING",
                     89:     "REDIRECT_STATUS",
                     90:     "REDIRECT_URL",
                     91:     "REQUEST_METHOD",
                     92:     "REQUEST_URI",
                     93:     "SCRIPT_FILENAME",
                     94:     "SCRIPT_NAME",
                     95:     "SCRIPT_URI",
                     96:     "SCRIPT_URL",
                     97:     "SERVER_ADMIN",
                     98:     "SERVER_NAME",
                     99:     "SERVER_ADDR",
                    100:     "SERVER_PORT",
                    101:     "SERVER_PROTOCOL",
                    102:     "SERVER_SOFTWARE",
                    103:     "UNIQUE_ID",
                    104:     "USER_NAME",
                    105:     "TZ",
                    106:     NULL
                    107: };
                    108: 
1.111     paf       109: // statics
1.33      paf       110: 
1.112     paf       111: static const String::Body adate_name("adate");
                    112: static const String::Body mdate_name("mdate");
                    113: static const String::Body cdate_name("cdate");
1.32      paf       114: 
1.1       paf       115: // methods
                    116: 
1.125     paf       117: static bool is_text_mode(const String& mode) {
                    118:        if(mode==TEXT_MODE_NAME)
                    119:                return true;
                    120:        if(mode==BINARY_MODE_NAME)
                    121:                return false;
                    122:        throw Exception("parser.runtime",
                    123:                &mode,
                    124:                "is invalid mode, must be either '"TEXT_MODE_NAME"' or '"BINARY_MODE_NAME"'");
                    125: }
                    126: 
1.111     paf       127: static void _save(Request& r, MethodParams& params) {
                    128:        Value& vmode_name=params. as_no_junction(0, "mode must not be code");
                    129:        Value& vfile_name=params.as_no_junction(1, "file name must not be code");
1.4       paf       130: 
1.7       paf       131:        // save
1.111     paf       132:        GET_SELF(r, VFile).save(r.absolute(vfile_name.as_string()),
1.125     paf       133:                is_text_mode(vmode_name.as_string()));
1.7       paf       134: }
                    135: 
1.111     paf       136: static void _delete(Request& r, MethodParams& params) {
                    137:        Value& vfile_name=params.as_no_junction(0, "file name must not be code");
1.7       paf       138: 
                    139:        // unlink
1.68      paf       140:        file_delete(r.absolute(vfile_name.as_string()));
1.1       paf       141: }
                    142: 
1.111     paf       143: static void _move(Request& r, MethodParams& params) {
                    144:        Value& vfrom_file_name=params.as_no_junction(0, "from file name must not be code");
                    145:        Value& vto_file_name=params.as_no_junction(1, "to file name must not be code");
1.45      parser    146: 
1.51      parser    147:        // move
1.68      paf       148:        file_move(
1.45      parser    149:                r.absolute(vfrom_file_name.as_string()),
                    150:                r.absolute(vto_file_name.as_string()));
                    151: }
                    152: 
1.111     paf       153: static void _load_pass_param(
                    154:                             HashStringValue::key_type key, 
                    155:                             HashStringValue::value_type value, 
                    156:                             HashStringValue *dest) {
                    157:        dest->put(key, value);
                    158: }
                    159: static void _load(Request& r, MethodParams& params) {
                    160:        Value& vmode_name=params. as_no_junction(0, "mode must not be code");
                    161:        const String& lfile_name=r.absolute(params.as_no_junction(1, "file name must not be code").as_string());
                    162:        Value* third_param=params.count()>2?&params.as_no_junction(2, "filename or options must not be code")
                    163:                :0;
                    164:        HashStringValue* third_param_hash=third_param?third_param->get_hash():0;
                    165:        size_t alt_filename_param_index=2;
1.104     paf       166:        if(third_param_hash)
                    167:                alt_filename_param_index++;
1.9       paf       168: 
1.132     paf       169:        HashStringValue* options=third_param_hash;
                    170:        size_t offset=0;
                    171:        size_t limit=0;
                    172:        if(options) {
                    173:                options=new HashStringValue(*options);
                    174:                if(Value *voffset=(Value *)options->get(sql_offset_name)) {
                    175:                        offset=r.process_to_value(*voffset).as_int();
                    176:                }
                    177:                if(Value *vlimit=(Value *)options->get(sql_limit_name)) {
                    178:                        limit=r.process_to_value(*vlimit).as_int();
                    179:                }
                    180:                // no check on options count here, see file_read
                    181:        }
1.111     paf       182:        File_read_result file=file_read(r.charsets, lfile_name,
1.125     paf       183:                is_text_mode(vmode_name.as_string()),
1.132     paf       184:                options, true, 0, offset, limit
1.104     paf       185:        );
1.9       paf       186: 
1.111     paf       187:        const char *user_file_name=params.count()>alt_filename_param_index?
                    188:                params.as_string(alt_filename_param_index, "filename must be string").cstr()
                    189:                :lfile_name.cstr(String::L_FILE_SPEC);
                    190: 
                    191:        Value* vcontent_type=0;
                    192:        if(file.headers)
1.129     paf       193:        {
                    194:                if(Value* remote_content_type=file.headers->get("CONTENT-TYPE"))
                    195:                        vcontent_type=new VString(*new String(remote_content_type->as_string().cstr()));
                    196:        } 
1.104     paf       197:        if(!vcontent_type)
1.111     paf       198:                vcontent_type=new VString(r.mime_type_of(user_file_name));
1.10      paf       199:        
1.111     paf       200:        VFile& self=GET_SELF(r, VFile);
                    201:        self.set(true/*tainted*/, file.str, file.length, user_file_name, vcontent_type);
                    202:        if(file.headers)
1.143     paf       203:                file.headers->for_each<HashStringValue*>(_load_pass_param, &self.fields());
1.9       paf       204: }
                    205: 
1.138     paf       206: static void _create(Request& r, MethodParams& params) {
                    207:        Value& vmode_name=params. as_no_junction(0, "mode must not be code");
                    208:        if(!is_text_mode(vmode_name.as_string()))
                    209:                throw Exception("parser.runtime",
                    210:                        0,
                    211:                        "only text mode is currently supported");
                    212: 
                    213:        const char* user_file_name_cstr=r.absolute(
                    214:                params.as_no_junction(1, "file name must not be code").as_string()).cstr(String::L_FILE_SPEC);
                    215: 
                    216:        const String& content=params.as_string(2, "content must be string");
                    217:        const char* content_cstr=content.cstr(String::L_UNSPECIFIED); // explode content, honor tainting changes
                    218: 
                    219:        VString* vcontent_type=new VString(r.mime_type_of(user_file_name_cstr));
                    220:        
                    221:        VFile& self=GET_SELF(r, VFile);
                    222:        self.set(true/*tainted*/, content_cstr, strlen(content_cstr), user_file_name_cstr, vcontent_type);
                    223: }
                    224: 
1.111     paf       225: static void _stat(Request& r, MethodParams& params) {
                    226:        Value& vfile_name=params.as_no_junction(0, "file name must not be code");
1.25      paf       227: 
                    228:        const String& lfile_name=vfile_name.as_string();
                    229: 
1.40      parser    230:        size_t size;
                    231:        time_t atime, mtime, ctime;
                    232:        file_stat(r.absolute(lfile_name),
                    233:                size,
                    234:                atime, mtime, ctime);
1.25      paf       235:        
1.111     paf       236:        VFile& self=GET_SELF(r, VFile);
                    237:        self.set(true/*tainted*/, 0/*no bytes*/, size);
                    238:        HashStringValue& ff=self.fields();
                    239:        ff.put(adate_name, new VDate(atime));
                    240:        ff.put(mdate_name, new VDate(mtime));
                    241:        ff.put(cdate_name, new VDate(ctime));
                    242:        ff.put(content_type_name, new VString(r.mime_type_of(lfile_name.cstr(String::L_FILE_SPEC))));
1.25      paf       243: }
                    244: 
1.111     paf       245: static bool is_safe_env_key(const char* key) {
                    246:        for(const char* validator=key; *validator; validator++) {
                    247:                char c=*validator;
                    248:                if(!(c>='A' && c<='Z' || c>='0' && c<='9' || c=='_' || c=='-'))
                    249:                        return false;
                    250:        }
1.88      paf       251:        if(strncasecmp(key, "HTTP_", 5)==0)
1.83      paf       252:                return true;
1.87      paf       253:        if(strncasecmp(key, "CGI_", 4)==0)
1.83      paf       254:                return true;
                    255:        for(int i=0; suexec_safe_env_lst[i]; i++) {
1.87      paf       256:                if(strcasecmp(key, suexec_safe_env_lst[i])==0)
1.83      paf       257:                        return true;
                    258:        }
                    259:        return false;
                    260: }
1.90      paf       261: #ifndef DOXYGEN
                    262: struct Append_env_pair_info {
1.141     paf       263:        Request_charsets* charsets;
1.111     paf       264:        HashStringString* env;
1.100     paf       265:        Value* vstdin;
1.90      paf       266: };
                    267: #endif
1.111     paf       268: static void append_env_pair(
                    269:                            HashStringValue::key_type akey, 
                    270:                            HashStringValue::value_type avalue, 
                    271:                            Append_env_pair_info *info) {
                    272:        if(akey==STDIN_EXEC_PARAM_NAME) {
                    273:                info->vstdin=avalue;
                    274:        } else if(akey==CHARSET_EXEC_PARAM_NAME) {
1.141     paf       275:                // ignore, already processed
1.90      paf       276:        } else {
1.111     paf       277:                if(!is_safe_env_key(akey.cstr()))
1.90      paf       278:                        throw Exception("parser.runtime",
1.111     paf       279:                                new String(akey, String::L_TAINTED),
1.90      paf       280:                                "not safe environment variable");
1.141     paf       281:                info->env->put(akey, avalue->as_string().cstr_to_string_body(String::L_UNSPECIFIED, 0, info->charsets));
1.90      paf       282:        }
1.22      paf       283: }
1.94      paf       284: #ifndef DOXYGEN
                    285: struct Pass_cgi_header_attribute_info {
1.111     paf       286:        Charset* charset;
                    287:        HashStringValue* fields;
                    288:        Value* content_type;
1.94      paf       289: };
                    290: #endif
1.111     paf       291: static void pass_cgi_header_attribute(
                    292:                                      ArrayString::element_type astring, 
                    293:                                      Pass_cgi_header_attribute_info* info) {
                    294:        size_t colon_pos=astring->pos(':');
1.130     paf       295:        if(colon_pos!=STRING_NOT_FOUND) {
1.111     paf       296:                const String& key=astring->mid(0, colon_pos).change_case(
                    297:                        *info->charset, String::CC_UPPER);
1.130     paf       298:                Value* value=new VString(astring->mid(colon_pos+1, astring->length()).trim());
1.111     paf       299:                info->fields->put(key, value);
1.94      paf       300:                if(key=="CONTENT-TYPE")
1.111     paf       301:                        info->content_type=value;
1.94      paf       302:        }
1.29      paf       303: }
1.90      paf       304: /// @todo fix `` in perl - they produced flipping consoles and no output to perl
1.111     paf       305: static void _exec_cgi(Request& r, MethodParams& params,
1.41      parser    306:                                          bool cgi) {
1.21      paf       307: 
1.111     paf       308:        Value& vfile_name=params.as_no_junction(0, "file name must not be code");
1.21      paf       309: 
1.23      paf       310:        const String& script_name=r.absolute(vfile_name.as_string());
                    311: 
1.111     paf       312:        HashStringString env;
1.62      paf       313:        #define ECSTR(name, value_cstr) \
1.111     paf       314:                if(value_cstr) \
                    315:                        env.put( \
1.112     paf       316:                                String::Body(#name), \
                    317:                                String::Body(value_cstr, 0)); \
1.82      paf       318:        // passing SAPI::environment
1.111     paf       319:        if(const char *const *pairs=SAPI::environment(r.sapi_info)) {
                    320:                while(const char* pair=*pairs++)
                    321:                        if(const char* eq_at=strchr(pair, '='))
                    322:                                if(eq_at[1]) // has value
                    323:                                        env.put(
                    324:                                                pa_strdup(pair, eq_at-pair),
                    325:                                                pa_strdup(eq_at+1, 0));
1.82      paf       326:        }
                    327: 
1.23      paf       328:        // const
1.63      paf       329:        ECSTR(GATEWAY_INTERFACE, "CGI/1.1");
1.23      paf       330:        // from Request.info
1.111     paf       331:        ECSTR(DOCUMENT_ROOT, r.request_info.document_root);
                    332:        ECSTR(PATH_TRANSLATED, r.request_info.path_translated);
                    333:        ECSTR(REQUEST_METHOD, r.request_info.method);
                    334:        ECSTR(QUERY_STRING, r.request_info.query_string);
                    335:        ECSTR(REQUEST_URI, r.request_info.uri);
                    336:        ECSTR(CONTENT_TYPE, r.request_info.content_type);
1.23      paf       337:        char content_length_cstr[MAX_NUMBER];  
1.111     paf       338:        snprintf(content_length_cstr, MAX_NUMBER, "%u", r.request_info.content_length);
                    339:        //String content_length(content_length_cstr);
1.62      paf       340:        ECSTR(CONTENT_LENGTH, content_length_cstr);
1.82      paf       341:        // SCRIPT_*
1.119     paf       342:        env.put(String::Body("SCRIPT_NAME"), script_name);
                    343:        //env.put(String::Body("SCRIPT_FILENAME"), ??&script_name);
1.23      paf       344: 
1.111     paf       345:        bool stdin_specified=false;
1.90      paf       346:        // environment & stdin from param
1.111     paf       347:        String *in=new String();
1.109     paf       348:        Charset *charset=0; // default script works raw_in 'source' charset = no transcoding needed
1.111     paf       349:        if(params.count()>1) {
                    350:                Value& venv=params.as_no_junction(1, "env must not be code");
                    351:                if(HashStringValue* user_env=venv.get_hash()) {
1.141     paf       352:                        // $.charset  [previewing to handle URI pieces]
                    353:                        if(Value* vcharset=user_env->get(CHARSET_EXEC_PARAM_NAME))
                    354:                                charset=&charsets.get(vcharset->as_string()
                    355:                                        .change_case(r.charsets.source(), String::CC_UPPER));
                    356: 
                    357:                        // $.others
                    358:                        Append_env_pair_info info={&r.charsets, &env, 0};
                    359:                        {
1.144     paf       360:                                // influence tainting
                    361:                                // main target -- $.QUERY_STRING -- URLencoding of tainted pieces to String::L_URI lang
1.141     paf       362:                                Temp_client_charset temp(r.charsets, charset? *charset: r.charsets.source());
1.143     paf       363:                                user_env->for_each<Append_env_pair_info*>(append_env_pair, &info);
1.141     paf       364:                        }
1.109     paf       365:                        // $.stdin
1.103     paf       366:                        if(info.vstdin) {
1.111     paf       367:                                stdin_specified=true;
                    368:                                if(const String* sstdin=info.vstdin->get_string()) {
                    369:                                        in->append(*sstdin, String::L_CLEAN, true);
1.103     paf       370:                                } else
1.111     paf       371:                                        if(VFile* vfile=static_cast<VFile *>(info.vstdin->as("file", false)))
                    372:                                                in->append_know_length((const char* )vfile->value_ptr(), vfile->value_size(), String::L_TAINTED);
1.100     paf       373:                                        else
                    374:                                                throw Exception("parser.runtime",
1.111     paf       375:                                                        0,
1.100     paf       376:                                                        STDIN_EXEC_PARAM_NAME " parameter must be string or file");
1.103     paf       377:                        }
1.90      paf       378:                }
1.21      paf       379:        }
                    380: 
1.90      paf       381:        // argv from params
1.111     paf       382:        ArrayString argv;
                    383:        if(params.count()>2) {
1.144     paf       384:                // influence tainting 
                    385:                // main target -- URLencoding of tainted pieces to String::L_URI lang
                    386:                Temp_client_charset temp(r.charsets, charset? *charset: r.charsets.source());
                    387:                for(size_t i=2; i<params.count(); i++) {
                    388:                        const String& param=params.as_string(i, "parameter must be string");
1.145     misha     389:                        if(param.length() > 0) {
                    390:                                argv+=new String(param.cstr_to_string_body(String::L_UNSPECIFIED, 0, &r.charsets), String::L_AS_IS);
                    391:                        }
1.144     paf       392:                }
1.21      paf       393:        }
1.90      paf       394: 
1.109     paf       395:        // transcode if necessary
                    396:        if(charset) {
1.111     paf       397:                Charset::transcode(env, r.charsets.source(), *charset);
                    398:                Charset::transcode(argv, r.charsets.source(), *charset);
                    399:                in=&Charset::transcode(*in, r.charsets.source(), *charset);
                    400:        }
                    401:        // @todo 
                    402:        // ifdef WIN32 do  OEM->ANSI transcode on some(.cmd?) programs to 
                    403:        // match silent conversion in OS
                    404: 
                    405:        // exec!
                    406:        PA_exec_result execution=
                    407:                pa_exec(false/*forced_allow*/, script_name, &env, argv, *in);
                    408: 
                    409:        String *real_out=&execution.out;
                    410:        String *real_err=&execution.err;
                    411:        // transcode if necessary
                    412:        if(charset) {
                    413:                real_out=&Charset::transcode(*real_out, *charset, r.charsets.source());
                    414:                real_err=&Charset::transcode(*real_err, *charset, r.charsets.source());
1.109     paf       415:        }
                    416: 
1.111     paf       417:        VFile& self=GET_SELF(r, VFile);
1.109     paf       418: 
1.111     paf       419:        const String* body=real_out; // ^file:exec
                    420:        const char* eol_marker=0; size_t eol_marker_size;
                    421:        const String* header=0;
1.41      parser    422:        if(cgi) { // ^file:cgi
1.111     paf       423:                // construct with 'out' body and header
                    424:                size_t dos_pos=real_out->pos("\r\n\r\n", 4);
                    425:                size_t unix_pos=real_out->pos("\n\n", 2);
                    426: 
                    427:                bool unix_header_break;
                    428:                switch((dos_pos!=STRING_NOT_FOUND?10:00) + (unix_pos!=STRING_NOT_FOUND?01:00)) {
                    429:                case 10: // dos
                    430:                        unix_header_break=false;
                    431:                        break;
                    432:                case 01: // unix
                    433:                        unix_header_break=true;
                    434:                        break;
                    435:                case 11: // dos & unix
                    436:                        unix_header_break=unix_pos<dos_pos;
                    437:                        break;
                    438:                default: // 00
                    439:                        unix_header_break=false; // calm down, compiler
1.74      paf       440:                        throw Exception(0,
1.111     paf       441:                                0,
1.90      paf       442:                                "output does not contain CGI header; "
                    443:                                "exit status=%d; stdoutsize=%u; stdout: \"%s\"; stderrsize=%u; stderr: \"%s\"", 
1.111     paf       444:                                        execution.status, 
                    445:                                        (uint)real_out->length(), real_out->cstr(),
                    446:                                        (uint)real_err->length(), real_err->cstr());
                    447:                        break; //never reached
                    448:                }
                    449: 
                    450:                int header_break_pos;
                    451:                if(unix_header_break) {
                    452:                        header_break_pos=unix_pos;
                    453:                        eol_marker="\n"; eol_marker_size=1;
                    454:                } else {
                    455:                        header_break_pos=dos_pos;
                    456:                        eol_marker="\r\n"; eol_marker_size=2;
                    457:                }
1.21      paf       458: 
1.109     paf       459:                header=&real_out->mid(0, header_break_pos);
1.111     paf       460:                body=&real_out->mid(header_break_pos+eol_marker_size*2, real_out->length());
1.29      paf       461:        }
1.41      parser    462:        // body
1.111     paf       463:        self.set(false/*not tainted*/, body->cstr(), body->length());
1.94      paf       464: 
                    465:        // $fields << header
1.98      paf       466:        if(header && eol_marker) {
1.111     paf       467:                ArrayString rows;
                    468:                size_t pos_after=0;
                    469:                header->split(rows, pos_after, eol_marker);
1.116     paf       470:                Pass_cgi_header_attribute_info info={0, 0, 0};
1.111     paf       471:                info.charset=&r.charsets.source();
                    472:                info.fields=&self.fields();
1.94      paf       473:                rows.for_each(pass_cgi_header_attribute, &info);
                    474:                if(info.content_type)
1.111     paf       475:                        self.fields().put(content_type_name, info.content_type);
1.94      paf       476:        }
1.21      paf       477: 
1.42      parser    478:        // $status
1.111     paf       479:        self.fields().put(file_status_name, new VInt(execution.status));
1.21      paf       480:        
                    481:        // $stderr
1.111     paf       482:        if(real_err->length())
1.21      paf       483:                self.fields().put(
1.119     paf       484:                        String::Body("stderr"),
1.111     paf       485:                        new VString(*real_err));
1.21      paf       486: }
1.111     paf       487: static void _exec(Request& r, MethodParams& params) {
                    488:        _exec_cgi(r, params, false);
1.41      parser    489: }
1.111     paf       490: static void _cgi(Request& r, MethodParams& params) {
                    491:        _exec_cgi(r, params, true);
1.41      parser    492: }
                    493: 
1.111     paf       494: static void _list(Request& r, MethodParams& params) {
                    495:        Value& relative_path=params.as_no_junction(0, "path must not be code");
1.47      parser    496: 
1.111     paf       497:        const String* regexp;
1.47      parser    498:        pcre *regexp_code;
1.81      paf       499:        const int ovecsize=(1/*match*/)*3;
                    500:        int ovector[ovecsize];
1.111     paf       501:        if(params.count()>1) {
                    502:                regexp=&params.as_no_junction(1, "regexp must not be code").as_string();
1.47      parser    503: 
1.111     paf       504:                const char* pattern=regexp->cstr();
                    505:                const char* errptr;
1.47      parser    506:                int erroffset;
                    507:                regexp_code=pcre_compile(pattern, PCRE_EXTRA | PCRE_DOTALL, 
                    508:                        &errptr, &erroffset, 
1.111     paf       509:                        r.charsets.source().pcre_tables);
1.47      parser    510: 
                    511:                if(!regexp_code)
1.74      paf       512:                        throw Exception(0, 
1.111     paf       513:                                &regexp->mid(erroffset, regexp->length()), 
1.47      parser    514:                                "regular expression syntax error - %s", errptr);
1.114     paf       515:        } else {
                    516:                regexp=0; // not used, just to calm down compiler
1.47      parser    517:                regexp_code=0;
1.114     paf       518:        }
1.47      parser    519: 
                    520: 
1.111     paf       521:        const char* absolute_path_cstr=r.absolute(relative_path.as_string()).cstr(String::L_FILE_SPEC);
1.47      parser    522: 
1.111     paf       523:        Table::columns_type columns(new ArrayString);
                    524:        *columns+=new String("name");
                    525:        Table& table=*new Table(columns);
1.47      parser    526: 
                    527:        LOAD_DIR(absolute_path_cstr, 
1.111     paf       528:                const char* file_name_cstr=ffblk.ff_name;
                    529:                size_t file_name_size=strlen(file_name_cstr);
1.47      parser    530:                bool suits=true;
                    531:                if(regexp_code) {
                    532:                        int exec_result=pcre_exec(regexp_code, 0, 
                    533:                                ffblk.ff_name, file_name_size, 0, 
                    534:                                0, ovector, ovecsize);
                    535:                        
                    536:                        if(exec_result==PCRE_ERROR_NOMATCH)
                    537:                                suits=false;
                    538:                        else if(exec_result<0) {
                    539:                                (*pcre_free)(regexp_code);
1.74      paf       540:                                throw Exception(0, 
1.47      parser    541:                                        regexp, 
                    542:                                        "regular expression execute (%d)", 
                    543:                                                exec_result);
                    544:                        }
                    545:                }
                    546: 
                    547:                if(suits) {
1.111     paf       548:                        Table::element_type row(new ArrayString);
                    549:                        *row+=new String(pa_strdup(file_name_cstr, file_name_size), file_name_size, true);
                    550:                        table+=row;
1.47      parser    551:                }
                    552:        );
                    553: 
                    554:        if(regexp_code)
1.111     paf       555:                pcre_free(regexp_code);
1.47      parser    556: 
1.60      parser    557:        // write out result
1.111     paf       558:        r.write_no_lang(*new VTable(&table));
1.47      parser    559: }
1.21      paf       560: 
1.69      paf       561: #ifndef DOXYGEN
                    562: struct Lock_execute_body_info {
1.111     paf       563:        Request* r;
                    564:        Value* body_code;
1.69      paf       565: };
                    566: #endif
1.111     paf       567: static void lock_execute_body(int , void *ainfo) {
                    568:        Lock_execute_body_info& info=*static_cast<Lock_execute_body_info *>(ainfo);
1.69      paf       569:        // execute body
1.78      paf       570:        info.r->write_assign_lang(info.r->process(*info.body_code));
1.69      paf       571: };
1.111     paf       572: static void _lock(Request& r, MethodParams& params) {
                    573:        const String& file_spec=r.absolute(params.as_string(0, "file name must be string"));
1.116     paf       574:        Lock_execute_body_info info={
                    575:                &r, 
1.117     paf       576:                &params.as_junction(1, "body must be code")
1.116     paf       577:        };
1.69      paf       578: 
1.70      paf       579:        file_write_action_under_lock(file_spec, "lock", lock_execute_body, &info);
1.69      paf       580: }
                    581: 
1.111     paf       582: static int lastposafter(const String& s, size_t after, const char* substr, size_t substr_size, bool beforelast=false) {
1.114     paf       583:        size_t size=0; // just to calm down compiler
1.89      paf       584:        if(beforelast)
1.111     paf       585:                size=s.length();
1.116     paf       586:        size_t at;
1.112     paf       587:        while((at=s.pos(String::Body(substr, substr_size), after))!=STRING_NOT_FOUND) {
1.89      paf       588:                size_t newafter=at+substr_size/*skip substr*/;
                    589:                if(beforelast && newafter==size)
                    590:                        break;
                    591:                after=newafter;
                    592:        }
                    593: 
                    594:        return after;
                    595: }
                    596: 
1.111     paf       597: static void _find(Request& r, MethodParams& params) {
                    598:        const String& file_name=params.as_no_junction(0, "file name must not be code").as_string();
                    599:        const String* file_spec;
1.90      paf       600:        if(file_name.first_char()=='/')
                    601:                file_spec=&file_name;
                    602:        else 
1.111     paf       603:                file_spec=&r.relative(r.request_info.uri, file_name);
1.90      paf       604: 
                    605:        // easy way
1.142     paf       606:        if(file_exist(r.absolute(*file_spec))) {
1.96      paf       607:                r.write_assign_lang(*file_spec);
1.90      paf       608:                return;
                    609:        }
                    610: 
                    611:        // monkey way
                    612:        int after_base_slash=lastposafter(*file_spec, 0, "/", 1);
1.111     paf       613:        const String* dirname=&file_spec->mid(0, after_base_slash);
                    614:        const String& basename=file_spec->mid(after_base_slash, file_spec->length());
1.90      paf       615: 
                    616:        int after_monkey_slash;
                    617:        while((after_monkey_slash=lastposafter(*dirname, 0, "/", 1, true))>0) {
1.111     paf       618:                String test_name;
                    619:                test_name<<*(dirname=&dirname->mid(0, after_monkey_slash));
                    620:                test_name<<basename;
1.142     paf       621:                if(file_exist(r.absolute(test_name))) {
1.111     paf       622:                        r.write_assign_lang(test_name);
1.90      paf       623:                        return;
                    624:                }
                    625:        }
                    626: 
                    627:        // no way, not found
1.111     paf       628:        if(params.count()==2) {
                    629:                Value& not_found_code=params.as_junction(1, "not-found param must be code");
1.90      paf       630:                r.write_pass_lang(r.process(not_found_code));
                    631:        }
                    632: }
                    633: 
1.111     paf       634: static void _dirname(Request& r, MethodParams& params) {
                    635:        const String& file_spec=params.as_string(0, "file name must be string");
1.89      paf       636:     // /a/some.tar.gz > /a
                    637:        // /a/b/ > /a
                    638:        int afterslash=lastposafter(file_spec, 0, "/", 1, true);
                    639:        if(afterslash>0)
                    640:                r.write_assign_lang(file_spec.mid(0, afterslash==1?1:afterslash-1));
                    641:        else
1.111     paf       642:                r.write_assign_lang(String(".", 1));
1.89      paf       643: }
                    644: 
1.111     paf       645: static void _basename(Request& r, MethodParams& params) {
                    646:        const String& file_spec=params.as_string(0, "file name must be string");
1.89      paf       647:     // /a/some.tar.gz > some.tar.gz
                    648:        int afterslash=lastposafter(file_spec, 0, "/", 1);
1.111     paf       649:        r.write_assign_lang(file_spec.mid(afterslash, file_spec.length()));
1.89      paf       650: }
                    651: 
1.111     paf       652: static void _justname(Request& r, MethodParams& params) {
                    653:        const String& file_spec=params.as_string(0, "file name must be string");
1.89      paf       654:     // /a/some.tar.gz > some.tar
                    655:        int afterslash=lastposafter(file_spec, 0, "/", 1);
                    656:        int afterdot=lastposafter(file_spec, afterslash, ".", 1);
1.111     paf       657:        r.write_assign_lang(file_spec.mid(afterslash, afterdot!=afterslash?afterdot-1:file_spec.length()));
1.89      paf       658: }
1.111     paf       659: static void _justext(Request& r, MethodParams& params) {
                    660:        const String& file_spec=params.as_string(0, "file name must be string");
1.89      paf       661:     // /a/some.tar.gz > gz
                    662:        int afterdot=lastposafter(file_spec, 0, ".", 1);
                    663:        if(afterdot>0)
1.111     paf       664:                r.write_assign_lang(file_spec.mid(afterdot, file_spec.length()));
1.89      paf       665: }
                    666: 
1.111     paf       667: static void _fullpath(Request& r, MethodParams& params) {
                    668:        const String& file_spec=params.as_string(0, "file name must be string");
                    669:        const String* result;
1.102     paf       670:        if(file_spec.first_char()=='/')
                    671:                result=&file_spec;
                    672:        else {
                    673:                // /some/page.html: ^file:fullpath[a.gif] => /some/a.gif
                    674:                const String& full_disk_path=r.absolute(file_spec);
1.111     paf       675:                size_t document_root_length=strlen(r.request_info.document_root);
1.106     paf       676: 
                    677:                if(document_root_length>0) {
1.111     paf       678:                        char last_char=r.request_info.document_root[document_root_length-1];
1.106     paf       679:                        if(last_char == '/' || last_char == '\\')
                    680:                                --document_root_length;
                    681:                }
1.111     paf       682:                result=&full_disk_path.mid(document_root_length,  full_disk_path.length());
1.102     paf       683:        }
                    684:        r.write_assign_lang(*result);
                    685: }
                    686: 
1.121     paf       687: static void _sql_string(Request& r, MethodParams&) {
                    688:        VFile& self=GET_SELF(r, VFile);
                    689: 
                    690:        const char *quoted=r.connection()->quote(self.value_ptr(), self.value_size());
                    691:        r.write_assign_lang(*new String(quoted));
                    692: }
1.89      paf       693: 
1.122     paf       694: #ifndef DOXYGEN
                    695: class File_sql_event_handlers: public SQL_Driver_query_event_handlers {
                    696:        const String& statement_string; const char* statement_cstr;
                    697:        int got_columns;
                    698:        int got_cells;
                    699: public:
                    700:        String::C value;
1.131     paf       701:        const String* user_file_name;
                    702:        const String* user_content_type;
1.122     paf       703: public:
                    704:        File_sql_event_handlers(
                    705:                const String& astatement_string, const char* astatement_cstr):
                    706:                statement_string(astatement_string), statement_cstr(astatement_cstr),
                    707:                got_columns(0),
                    708:                got_cells(0),
                    709:                user_file_name(0),
                    710:                user_content_type(0) {}
                    711: 
                    712:        bool add_column(SQL_Error& error, const char* /*str*/, size_t /*length*/) {
                    713:                if(got_columns++==3) {
                    714:                        error=SQL_Error("parser.runtime", "result must contain not more then 3 columns");
                    715:                        return true;
                    716:                }
                    717:                return false;
                    718:        }
                    719:        bool before_rows(SQL_Error& /*error*/ ) { /* ignore */ return false; }
                    720:        bool add_row(SQL_Error& /*error*/) { /* ignore */ return false; }
                    721:        bool add_row_cell(SQL_Error& error, const char* str, size_t length) {
                    722:                try {
                    723:                        switch(got_cells++) {
                    724:                                case 0:
                    725:                                        value=String::C(str, length); 
                    726:                                        break;
                    727:                                case 1:
1.131     paf       728:                                        if(!user_file_name) // user not specified?
                    729:                                                user_file_name=new String(str, length, true);
1.122     paf       730:                                        break;
                    731:                                case 2:
1.131     paf       732:                                        if(!user_content_type) // user not specified?
                    733:                                                user_content_type=new String(str, length, true);
1.122     paf       734:                                        break;
                    735:                                default:
                    736:                                        error=SQL_Error("parser.runtime", "result must not contain more then one row, three rows");
                    737:                                        return true;
                    738:                        }
                    739:                        return false;
                    740:                } catch(...) {
                    741:                        error=SQL_Error("exception occured in File_sql_event_handlers::add_row_cell");
                    742:                        return true;
                    743:                }
                    744:        }
                    745: };
                    746: #endif
                    747: static void _sql(Request& r, MethodParams& params) {
1.131     paf       748:        Value& statement=params.as_junction(0, "statement must be code");
1.122     paf       749: 
                    750:        Temp_lang temp_lang(r, String::L_SQL);
                    751:        const String& statement_string=r.process_to_string(statement);
                    752:        const char* statement_cstr=
                    753:                statement_string.cstr(String::L_UNSPECIFIED, r.connection());
                    754:        File_sql_event_handlers handlers(statement_string, statement_cstr);
1.131     paf       755: 
                    756:        if(params.count()>1)
                    757:                if(HashStringValue* options=
                    758:                        params.as_no_junction(1, "param must not be code").get_hash()) {
                    759:                        int valid_options=0;
                    760:                        if(Value* vfilename=options->get(NAME_NAME)) {
                    761:                                valid_options++;
                    762:                                handlers.user_file_name=&vfilename->as_string();
                    763:                        }
                    764:                        if(Value* vcontent_type=options->get(CONTENT_TYPE_NAME)) {
                    765:                                valid_options++;
                    766:                                handlers.user_content_type=&vcontent_type->as_string();
                    767:                        }
                    768:                        if(valid_options!=options->count())
                    769:                                throw Exception("parser.runtime",
                    770:                                        0,
                    771:                                        "called with invalid option");
                    772:                }
                    773: 
                    774: 
1.122     paf       775:        r.connection()->query(
1.123     paf       776:                statement_cstr, 
                    777:                0, 0,
                    778:                0, 0, 
1.122     paf       779:                handlers,
                    780:                statement_string);
                    781: 
                    782:        if(!handlers.value)
                    783:                throw Exception("parser.runtime",
                    784:                        0,
                    785:                        "produced no result");
                    786: 
1.131     paf       787:        const char* user_file_name_cstr=handlers.user_file_name? handlers.user_file_name->cstr(): 0;
1.122     paf       788: 
                    789:        VString* vcontent_type=handlers.user_content_type? 
                    790:                new VString(*handlers.user_content_type)
                    791:                : user_file_name_cstr?
                    792:                        new VString(r.mime_type_of(user_file_name_cstr))
                    793:                        : 0;
                    794:        VFile& self=GET_SELF(r, VFile);
                    795:        self.set(true/*tainted*/, handlers.value.str, handlers.value.length, user_file_name_cstr, vcontent_type);
                    796: }
1.140     paf       797: 
1.139     paf       798: static void _base64(Request& r, MethodParams& params) {
1.140     paf       799:        VFile& self=GET_SELF(r, VFile);
1.139     paf       800:        if(params.count()) {
1.140     paf       801:                // decode
1.139     paf       802:                const char* cstr=params.as_string(0, "parameter must be string").cstr();
1.140     paf       803:                char* decoded_cstr=0;
1.139     paf       804:                size_t decoded_size=0;
                    805:                pa_base64_decode(cstr, strlen(cstr), decoded_cstr, decoded_size);
                    806:                if(decoded_cstr && decoded_size)
1.140     paf       807:                        self.set(true/*tainted*/, decoded_cstr, decoded_size);
                    808:        } else {
                    809:                // encode 
                    810:                const char* encoded=pa_base64_encode(self.value_ptr(), self.value_size());
                    811:                r.write_assign_lang(*new String(encoded, 0, true/*once ?param=base64(something) was needed*/));
1.139     paf       812:        }
                    813: }
1.140     paf       814: 
1.146     misha     815: static void _crc32(Request& r, MethodParams& params) {
                    816:        unsigned long crc32 = 0;
                    817:        if(&r.get_self() == file_class) {
                    818:                // ^file:crc32[file-name]
                    819:                if(params.count()) {
                    820:                        const String& file_spec=params.as_string(0, "file name must be string");
                    821:                        crc32=pa_crc32(r.absolute(file_spec));
                    822:                } else {
                    823:                        throw Exception("parser.runtime",
                    824:                                0,
                    825:                                "file name must be defined");
                    826:                }
                    827:        } else {
                    828:                // ^file.crc32[]
                    829:                VFile& self=GET_SELF(r, VFile);
                    830:                crc32=pa_crc32(self.value_ptr(), self.value_size());
                    831:        }
                    832:        r.write_no_lang(*new VInt(crc32));
                    833: }
                    834: 
                    835: 
1.147   ! misha     836: static void file_md5_file_action(
        !           837:                             struct stat& finfo, 
        !           838:                             int f, 
        !           839:                             const String& , const char* /*fname*/, bool, 
        !           840:                             void *context)
        !           841: {
        !           842:        PA_MD5_CTX& md5context=*static_cast<PA_MD5_CTX *>(context);
        !           843:        if(finfo.st_size) {
        !           844:                size_t nCount=0;
        !           845:                do {
        !           846:                        unsigned char buffer[FILE_BUFFER_SIZE];
        !           847:                        nCount = read(f, buffer, sizeof(buffer));
        !           848:                        if ( nCount ){
        !           849:                                pa_MD5Update(&md5context, (const unsigned char*)buffer, nCount);
        !           850:                        }
        !           851:                } while(nCount);
        !           852:        }
        !           853: }
        !           854: 
        !           855: const char* pa_md5(const String& file_spec)
        !           856: {
        !           857:        PA_MD5_CTX context;
        !           858:        unsigned char digest[16];
        !           859:        pa_MD5Init(&context);
        !           860:        file_read_action_under_lock(file_spec, "md5", file_md5_file_action, &context);
        !           861:        pa_MD5Final(digest, &context);
        !           862:        
        !           863:        return hex_string(digest, sizeof(digest), false);
        !           864: }
        !           865: 
        !           866: const char* pa_md5(const char *in, size_t in_size)
        !           867: {
        !           868:        PA_MD5_CTX context;
        !           869:        unsigned char digest[16];
        !           870:        pa_MD5Init(&context);
        !           871:        pa_MD5Update(&context, (const unsigned char*)in, in_size);
        !           872:        pa_MD5Final(digest, &context);
        !           873:        
        !           874:        return hex_string(digest, sizeof(digest), false);
        !           875: }
        !           876: 
        !           877: static void _md5(Request& r, MethodParams& params) {
        !           878:        const char* md5;
        !           879:        if(&r.get_self() == file_class) {
        !           880:                // ^file:md5[file-name]
        !           881:                if(params.count()) {
        !           882:                        const String& file_spec=params.as_string(0, "file name must be string");
        !           883:                        md5=pa_md5(r.absolute(file_spec));
        !           884:                } else {
        !           885:                        throw Exception("parser.runtime",
        !           886:                                0,
        !           887:                                "file name must be defined");
        !           888:                }
        !           889:        } else {
        !           890:                // ^file.md5[]
        !           891:                VFile& self=GET_SELF(r, VFile);
        !           892:                md5=pa_md5(self.value_ptr(), self.value_size());
        !           893: 
        !           894:        }
        !           895:        r.write_no_lang(*new String(md5));
        !           896: }
        !           897: 
1.32      paf       898: // constructor
                    899: 
1.111     paf       900: MFile::MFile(): Methoded("file") {
1.146     misha     901:        // ^file::create[text;user-name;string]
                    902:        // ^file::create[binary;user-name;SOMEDAY SOMETHING]
1.138     paf       903:        add_native_method("create", Method::CT_DYNAMIC, _create, 3, 3);
                    904: 
1.146     misha     905:        // ^file.save[mode;file-name]
1.48      parser    906:        add_native_method("save", Method::CT_DYNAMIC, _save, 2, 2);
1.7       paf       907: 
1.146     misha     908:        // ^file:delete[file-name]
1.32      paf       909:        add_native_method("delete", Method::CT_STATIC, _delete, 1, 1);
1.45      parser    910: 
1.146     misha     911:        // ^file:move[from-file-name;to-file-name]
1.45      parser    912:        add_native_method("move", Method::CT_STATIC, _move, 2, 2);
1.8       paf       913: 
1.146     misha     914:        // ^file::load[mode;disk-name]
                    915:        // ^file::load[mode;disk-name;user-name]
1.48      parser    916:        add_native_method("load", Method::CT_DYNAMIC, _load, 2, 3);
1.25      paf       917: 
1.146     misha     918:        // ^file::stat[disk-name]
1.32      paf       919:        add_native_method("stat", Method::CT_DYNAMIC, _stat, 1, 1);
1.21      paf       920: 
1.146     misha     921:        // ^file::cgi[file-name]
                    922:        // ^file::cgi[file-name;env hash]
                    923:        // ^file::cgi[file-name;env hash;1cmd;2line;3ar;4g;5s]
1.135     paf       924:        add_native_method("cgi", Method::CT_DYNAMIC, _cgi, 1, 2+50);
1.41      parser    925: 
1.146     misha     926:        // ^file::exec[file-name]
                    927:        // ^file::exec[file-name;env hash]
                    928:        // ^file::exec[file-name;env hash;1cmd;2line;3ar;4g;5s]
1.135     paf       929:        add_native_method("exec", Method::CT_DYNAMIC, _exec, 1, 2+50);
1.47      parser    930: 
                    931:        // ^file:list[path]
                    932:        // ^file:list[path][regexp]
                    933:        add_native_method("list", Method::CT_STATIC, _list, 1, 2);
1.69      paf       934: 
                    935:        // ^file:lock[path]{code}
                    936:        add_native_method("lock", Method::CT_STATIC, _lock, 2, 2);
1.90      paf       937: 
1.146     misha     938:        // ^file:find[file-name]
                    939:        // ^file:find[file-name]{when-not-found}
1.90      paf       940:        add_native_method("find", Method::CT_STATIC, _find, 1, 2);
1.47      parser    941: 
1.89      paf       942:     // ^file:dirname[/a/some.tar.gz]=/a
                    943:        // ^file:dirname[/a/b/]=/a
                    944:        add_native_method("dirname", Method::CT_STATIC, _dirname, 1, 1);
                    945:     // ^file:basename[/a/some.tar.gz]=some.tar.gz
                    946:     add_native_method("basename", Method::CT_STATIC, _basename, 1, 1);
                    947:     // ^file:justname[/a/some.tar.gz]=some.tar
                    948:        add_native_method("justname", Method::CT_STATIC, _justname, 1, 1);
                    949:     // ^file:justext[/a/some.tar.gz]=gz
                    950:        add_native_method("justext", Method::CT_STATIC, _justext, 1, 1);
1.102     paf       951:     // /some/page.html: ^file:fullpath[a.gif] => /some/a.gif
                    952:        add_native_method("fullpath", Method::CT_STATIC, _fullpath, 1, 1);
1.121     paf       953: 
                    954:     // ^file.sql-string[]
                    955:        add_native_method("sql-string", Method::CT_DYNAMIC, _sql_string, 0, 0);
1.122     paf       956: 
                    957:     // ^file::sql[[alt_name]]{}
                    958:        add_native_method("sql", Method::CT_DYNAMIC, _sql, 1, 2);
1.139     paf       959: 
1.146     misha     960:        // ^file::base64[string] << decode
1.139     paf       961:        // ^file.base64[] << encode
1.140     paf       962:        add_native_method("base64", Method::CT_DYNAMIC, _base64, 0, 1);
1.146     misha     963: 
                    964:        // ^file.crc32[]
                    965:        // ^file:crc32[file-name]
                    966:        add_native_method("crc32", Method::CT_ANY, _crc32, 0, 1);
1.147   ! misha     967: 
        !           968:        // ^file.md5[]
        !           969:        // ^file:md5[file-name]
        !           970:        add_native_method("md5", Method::CT_ANY, _md5, 0, 1);
        !           971: 
1.1       paf       972: }

E-mail: