Обява

Свий
Няма добавени обяви.

Web scraping, harvesting etc... Някой има ли опит с тези неща???

Свий
X
 
  • Филтър
  • Час
  • Покажи
Изчисти всичко
нови мнения

  • Web scraping, harvesting etc... Някой има ли опит с тези неща???

    Здравейте,

    Някой има ли опит с т.н. Web scraping, harvesting etc... ?

    Нуждая се от практически съвети и може би и от малко напътствия за едно мое начинание.

    Имам идея да скрейпвам множество сайтове за продажба на автомобили, да събирам конкретни данни, веднъж събрани данните ще ги наливам или в файлове и после в Оракъл ДБ, след това ще правя анализи и сравняване за определени условия и при изпълнение на условията ще пускам нотификация.

    На български казано, идеята ми е да търся примерно обява за Нисан патрул, след 1997 година и ако цената е под сума ХХХХ.ХХ ще получа съобщение по електронна поща с данните на обявата. Целта ми е да прескоча повечето разни автоджамбази да се докопат до хубавите оферти за джипки и да съм един от първите, които да се свържат със собственика.

    Миналата седмица закъснях с един час точно и джамбазите вече пътуваха към обявата, след още 30 мин бяха купили супер мега ултра изгоден джип и след една седмица видях същия джип на двойна цена като джамбазите бяха инвестирали колосалната сума от 50 кинта за гориво и 20 кинта за автомивка... супер ме е яд и се надъхах да впрегна усилия и воля и да ги цакам на мой терен, ако ме разбирате какво искам да кажа

    Освен сайтове за обяви, мисля да скрейпвам и форуми, там хубавите оферти са още по-обещаващи по принцип...

    За сега съм инсталирал Scrapy on Debian 7.0 + Oracle 11g XE.

    Знам, че има множество програмки - платени(3 цифрена сума) и няколко платени (6-7 цифрена сума) но все пак искам да започна с нещо малко и безплатно и ако има хляб в идеята ми ще инвестирам в софтуер и в платена подръжка примерно.

    Всякакви идеи ПО ТЕМАТА са добре дошли?

    Благодаря предварително,
    Жоро
    Бъдете живи и здрави!

  • #2
    От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

    Абонирам се за темата.

    Коментар


    • #3
      От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

      Мда и аз се замислих последно време да си напиша такова програмче, но все не остава пусто време. Правил съм едно време такива неща дето претакаха форма за кандидатсвтане в сайта на банката по този начин. За моето щях да ползвам C# за веб заявки и парсване на резултатите в някаква база, и статистика колко е паднала цената за даден период задължително .
      И трябва да се внимава със защитите от ботове че ще ти резнат квитанциите админите на сайта . Тази програмка ми помогна едно време имаше и други но съм ги забвавил http://fiddler2.com/home.
      Land Rover Discovery
      Където е текло пак ще тече ...

      Коментар


      • #4
        От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

        Не си заслужава усилията. Проверено. За БГ не знам как е, но Mobile.de имаше преди време API, през което можеше в реално време да се осведомяваш подобно на твоята идея за новите обяви. Разбирай реално време под 10 сек от публикуване на обявата докато ти звънне телефона с първия Мохамед, който те пита за "най-добра цена". Въпрос на време, докато на българските портали им светне лампата, че могат да правят кинти през API.

        Освен това с базирано на Линукс решение, ако не можеш да пишеш код, не мисля, че може да стане нещо аут ъф дъ бокс. А под Уиндовс има сравнително бързи варианти, ako можеш някой уиндовски ред код да пишеш, примерно WSH или VBA

        Коментар


        • #5
          От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

          Мерси много!

          За големите сайтове е ясно, че или има АПИ или ще ме ударят ако ги натоварвам.

          Обаче за форумите, има 100000000001 форума в които средно на 2-4 месеца излиза нещо уникално като цена, струва си да се автоматизира търсенето.

          Има и 100001 сайта на съдии изпълнители, общини, търгове, които освен, че нямат АПИ и не знаят какво е това не ги интересува, там съшо има смисъл да се следи...

          Аут оф дъ бокс има само шоколади Милка, знам, че ще трябва настройки и писане, не случайно казах за СКРЕЙПИ там готови паяци няма, всичко е биспоук

          Ако някой има опит в писането на паяци моля да даде знак, ако е нещо лесно и чудесно ще се разберем за възнаграждение?
          Бъдете живи и здрави!

          Коментар


          • #6
            От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

            Здравей. Добра идея.

            За да се случи обаче първото което трябва да се направи е точно описание на задачка, от което ще произлезе техническата спецификация.

            Ако искаш може да поговорим тук или по другите комуникационни канали.

            И аз се абонирам ;-)
            ;-)
            Grand Cherokee I - 5.2 - супер беше!
            нула 999 нула 3 нула 9 нула 3

            Коментар


            • #7
              От: Web scraping, harvesting etc... Някой има ли опит с тези неща???

              Здравейте всички,

              Да, така е, трябва да се напише описание и изисквания.

              Мислех си през уикенда за тези неща, ще седна и ще започна и скоро ще пусна документ.

              Мерси и до скоро.
              Бъдете живи и здрави!

              Коментар

              Активност за темата

              Свий

              В момента има 1 потребители онлайн. 0 потребители и 1 гости.

              Най-много потребители онлайн 8,787 в 16:37 на 21-06-23.

              Зареждам...
              X