Архивы рубрик: Парсинг

Вырезать javadoc комментарии

Вот нехитрое «нежадное» регулярное выражение, позвозяющее вырезать из вашего исходного файла все javadoc комментарии: 1′@/\*\*(.*)\*/@iUs’ Вот к примеру php скрипт, читающий содержимое файла, вырезающего комментарии и отображающего то, что получилось на экране: 1234$fileName = "/var/www/testFile.php"; $data = file_get_contents($fileName); $data = preg_replace(’@/\*\*(.*)\*/@iUs’, », $data); echo $data."\r\n"; Удачи!

Регулярное выражение для поиска телефонных номеров

Столкнулся с проблемой поиска телефонов в тексте – конкретно при анализе заголовка страниц сайтов. Есть любители написать телефон фирмы в заголовок, что меня естественно не радовало. После недолгих раздумий решил вырезать к чертям эти телефоны, решил использовать регулярные выражения, получилось во такое: [+\s?0-9]{0,}\s?\(?[0-9]{1,}\)?\s?[0-9]{1,}-?\s?[0-9]{1,}-?\s?[0-9]{1,} Ну а, для тех, кто еще только начинает заниматься программированием и не [...]

Парсер выдачи сайтов Яндекс / Yandex

Задача была выдрать урлы сайтов которые идут в поисковой выдаче Яндекса. Думал думал. Решил проблему разрешать на локальной машине. Для этого воспользовался дополнением к FireFox – Greasemonkey. Он умеет запускать JavaScript код про правилам, т.е. можно исполнить хоть на какой странице. Например: yandex.ru.

Закрыть все открытые теги php

1234567891011121314151617181920212223242526function close_dangling_tags($html){   //сначала берем все открытые теги   preg_match_all("#<([a-z]+)( .*)?(?!/)>#iU",$html,$result);   $openedtags=$result[1];     // после все закрытые   preg_match_all("#</([a-z]+)>#iU",$html,$result);   $closedtags=$result[1];   $len_opened = count($openedtags);   # все теги закрыты  if(count($closedtags) == $len_opened){     return $html;   }     $openedtags = array_reverse($openedtags);   # close tags  for($i=0;$i < $len_opened;$i++) {   [...]

мега парсер

1234567891011121314151617181920212223242526272829303132333435<pre> <?php         function read_feed($feed_url)         {                 if( empty($feed_url) ) { return FALSE; }                 $c      = curl_init();                 curl_setopt_array($c, array(         [...]

регулярные выражения, preg_match

Оригинал: [ссылка] Дмитрий Лебедев 2001-02-16 Описание базовых принципов и понятий работы регулярных выражений. Описание синтаксиса языка регулярных выражений стандарта POSIX. Функции. Примеры. реимущества стандарта реглярных выражений PCRE над POSIX. Рассыльщик почты с обильным использованием PCRE. Обещал написать про регулярные выражения. Писал, писал, но что-то не то выходит. Слишком мелкая конкретика, пересказывание руководства по php ([ссылка]). [...]

xml запрос на сервер использую curl / curl xml send request

Задача была связаться с api сайта seopult.ru и пообщаться с ним xml запросами. Не сразу нашел подходящий вариан с использованием curl. 1234567891011121314151617function sendXmlOverPost($url, $xml) {   $ch = curl_init();   curl_setopt($ch, CURLOPT_URL, $url); // Меняем тип заголовка содержимого   curl_setopt ($ch, CURLOPT_HTTPHEADER, Array("Content-Type: text/xml"));   curl_setopt($ch, CURLOPT_POST, 1);   curl_setopt($ch, CURLOPT_POSTFIELDS, $xml);   curl_setopt($ch, CURLOPT_RETURNTRANSFER, [...]