root > WikiSense-trunk > wikis > WikiConfig_de_wikipedia.php

WikiConfig_de_wikipedia.php

application/x-php, 5442 bytes (load raw)
<?php

$wiki['abbrevs']= '%\s(' .
                    'Dr|Prof|Emerit|[IVX]+|'.
                    'z\.'.SPACE_CHARS.'?B|zB|'.
                    'u\.'.SPACE_CHARS.'?U|'.
                    'u\.'.SPACE_CHARS.'?A|'.
                    'v\.'.SPACE_CHARS.'?Chr?|'.
                    'z\.'.SPACE_CHARS.'?Zt?|zZt|'.
                    'i\.'.SPACE_CHARS.'?A|i\.'.SPACE_CHARS.'?d\.'.SPACE_CHARS.'?R|'.
                    'resp|bzw|evtl|ca|et\.'.SPACE_CHARS.'al|'.
                    'eng|engl|fr|frant|lat|latein|gr|griech|'.
                    'St|Nr|'.
                    '\d{1,2}|[A-Z]{1,2}|\w'.
                    ')\.[\s\n]*$%su';

#$wiki['abbrevs']= '%bzw%s';

$wiki['nstalk']= 'Diskussion';
       
$wiki['namespaces']= array (
    100 => 'Portal',
    101 => 'Portal_Diskussion',
);

$wiki['stopwords']= array(
    'length' => 2,
    'pattern' => '/^(\d+|.*\.|([^A-Z]|Ä|Ö|Ü).*)$/',
    'words' => array(
        'der', 'die', 'das', 'sie', 'den', 'dem',
        'mein', 'meiner', 'meinem', 'meinen',
        'dein', 'deiner', 'deinen', 'deinen',
        'sein', 'seiner', 'seinem', 'seinen',
        'ihr', 'euer', 'euch',
        'uns', 'unser', 'unsere',
        'dass', 'daß',
        'hier', 'dort',
        'für', 'mit', 'über', 'auf', 'nach', 'aus', 'bei', 'seit',
        'mal', 'von', 'vom', 'vor', 'ans', 'über', 'unter', 'zwischen',
        'wer', 'wie', 'was', 'wen', 'wem', 'warum',
        'ich', 'wir', 'sich',
        'unser', 'unsere', 'unseren',
        'mir', 'mein', 'meine', 'mir', 'dir', 'dein', 'deine', 'dich',
        'sich', 'uns', 'unser',
        'nein', 'nicht', 'nichts', 'doch', 'aber', 'und', 'auch', 'noch',
        'alle', 'alles', 'allen',
        'kein', 'keine', 'keins', 'keiner', 'keinem', 'keinen',
        'ein', 'eine', 'eins', 'einer', 'einem', 'keinen',
        'gut', 'schlecht', 'wenn',
        'ist', 'sind', 'war', 'waren',
        'wird', 'werden', 'wirst', 'wurde', 'wurdest', 'würde', 'würdest',
        'hat', 'habe', 'haben', 'hast', 'hatte', 'hatten', 'hattest',
        'ein', 'eine', 'einer', 'einem',
        'kann', 'soll', 'muss', 'will', 'wollen'
    ),
);

$wiki['boxPattern']= '/\{\{\s*([\w-_]+)[-_ ]begin(\s*\|[^|]*?)*\s*\}\}.*\{\{\s*\1[-_ ]end\s*\}\}?/si';

$wiki['alternateMeaningPattern']= '/\{\{ *(?:[dD]ieser[ _]Artikel)( *\| *(.*?)) *\}\}/s'; #FIXME: nth parameter...
$wiki['disambigLinkPattern']= '/\{\{ *([Bb]egriffsklärungshinweis) *\}\}/s';
               
#$wiki['disambiguationPattern']= '/\{\{ *Begriffsklärung *\}\}/i'; #FIXME: unicode-escape!
#$wiki['listTitlePattern']= '/^(Liste (der )?(.*)|\d+|\d+ Jahrhundert|\d\d\d\d+er)$/';
#$wiki['badPagePattern']= '/\{\{ *Lösch[\w-]+ *\}\}|\{\{ *Falsch[\w-]+ *\}\}|\{\{ *URV[\w-]* *\}\}/i';  #FIXME: unicode-escape!

$wiki['resourceTitlePatterns']= array(
    RESOURCE_LIST => '/^Liste |^Formelsammlung /',
    RESOURCE_DISAMBIG => '/ \([Bb]egriffsklärung\)$/',
);

$wiki['resourceTextPatterns']= array(
    RESOURCE_DISAMBIG => '/\{\{ *([Bb]egriffsklärung|BKL) *\}\}/',
    RESOURCE_BAD => '/\{\{ *([Ll]öschen|[Ll]öschantrag.*|SLA|URV|) *\}\}/',
    RESOURCE_REDIRECT => REDIRECT_PATTERN,
    RESOURCE_LIST => '/\[\[ *[Kk]ategorie *: *Liste( +.+?)? *\]\]/',
);

$wiki['conceptTitlePatterns']= array(
    CONCEPT_TIME => '/^(\d{0,3}0er|\d\d?\. (Jahrhundert|Jahrtausend)|\d{1,4}|[123]?\d\. (Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember))( v\. Chr\.)?$/',
);

define('REGION_WORD_DE','(Gemeinde|Provinz|County|Stadteil|Landkreis|Bundesland|Land|Länder|Staat|[Bb]ezirk|Grafschaft|Region|Stadt|Städte|Ort|Bezirk)');

$wiki['conceptTextPatterns']= array(
    CONCEPT_TIME => '/\{\{ *([Jj]ahr(\d|tausend|hundert|zehnt)(Artikel|Navi)|[Nn]avigationstabelle Jahrtausende) *(\||\}\})/',
    CONCEPT_PERSON => '/\{\{ *[Pp]ersonendaten *\||\[\[ *([Kk]ategorie|[Cc]ategory) *: *([Gg](eborn|estorben) *(\d\d?\. jh\. (v\. Ch\.)?|\d{1,4})|[Mm]ann|[Ff]rau) *(\||\]\])|(^|\n)\'\'\'[^\n]+\'\'\'[, ][^\n]*\( *(\*|geb\.|geboren) [^\n]*\d+[^\n]*\)/',
    CONCEPT_NUMBER => '/\[\[ *[Kk]ategorie *: *([Gg]anze Zahl) *(\||\]\])|\{\{ *[Ii]nfobox Zahl *\|/',
    CONCEPT_LIFEFORM => '/class="(palaeobox|taxobox)"|\{\{ *[Tt]axonomy *\}\}/',
    CONCEPT_PLACE => '/\{\{ *([Kk]oordinate|[Ii]nfobox ([^}|]* )?'.REGION_WORD_DE.')[^}|]*\||^\| \[\[([^\|\]]+\| *)Fläche\]\]: \|\|.*^\| \[\[([^\|\]]+\| *)Einwohner(zahl)?\]\]: \|\||\[\[ *[Kk]ategorie *: *'.REGION_WORD_DE.' in /sm',
);


$wiki['disambigFirstLink']= true;

$wiki['boxNormalizer']= 'deBoxNormalizer';               

if (!function_exists('deBoxNormalizer')) {
    function deBoxNormalizer($text) {
        $text= preg_replace('!\{\{IPA *\| *(.+?) *\}\}!','\1',$text);
        return $text;
    }
}

$wiki['templateClasses']= array (
                    'delete' => '/^(Bild-Lizenz-unbekannt|BLU|Löschantrag.*|URV.*|Screenshot)$/i',
                    'problem' => '/^(Bild-wahrscheinlich-GFDL)$/i',
                    'license' => '/^(Bild-.*|gemeinfrei|GPL|GFDL|wappen-.*)?$/i',
                    'meta' => '/^(wappenrecht|bildschirmfoto|information)$/i',
                    'magic' => '/^(pagenamee?|namespacee?)$/i',
                    'babel' => '/^user-[\w\d\-]+$/i',
                    'language' => '/^(\w\w|German|Deutsch|English|Spanish|Русский|Russian)$/i',
                    'custom' => '!^user:.*/.*$!i',
                    'layout' => '/^(Bausteindesign\d*)$/i',
                );

?>