- [Case Studies](https://www.mergado.sk/kategorie/case-studies)
- [E‑commerce tipy](https://www.mergado.sk/kategorie/e-commerce-tipy)
- [E‑shopové riešenia a platformy](https://www.mergado.sk/kategorie/e-shopove-riesenia-platformy)
- [Mergado Pack](https://www.mergado.sk/kategorie/mergado-pack)
- [Mergado tipy](https://www.mergado.sk/kategorie/mergado-tipy)
- [Novinky v Mergade](https://www.mergado.sk/kategorie/novinky-v-mergade)
- [Novinky z porovnávačov cien](https://www.mergado.sk/kategorie/novinky-z-porovnavacov-cien)
- [Pracujeme s Mergadom](https://www.mergado.sk/kategorie/pracujeme-s-mergadom)
- [Rozhovory](https://www.mergado.sk/kategorie/rozhovory)
- [Rozšírenia](https://www.mergado.sk/kategorie/aplikacie)
- [S Mergadom do zahraničia](https://www.mergado.sk/kategorie/s-mergadom-do-zahranicia)
- [Zo života Mergada](https://www.mergado.sk/kategorie/zo-zivota-mergada)
 



 

 1. [  Domov  ](https://www.mergado.sk/)
2. [     Blog  ](https://www.mergado.sk/blog)
3. [     Rozšírenia  ](https://www.mergado.sk/kategorie/aplikacie)
4. <a class="flex items-center gap-2 hover:underline" href="" itemid="" itemprop="item" itemscope="" itemtype="https://schema.org/Thing">    **Stiahnite si celý web do jedného CSV so Scraping Camel** </a>
 
  

 

#  **Stiahnite si celý web do jedného CSV so Scraping Camel** 

 

 

 [    ![](https://www.mergado.sk/sites/default/files/perm/image/profil-foto.jpg)   Petra Marková  ](https://www.mergado.sk/blog/petra-markova) [Rozšírenia](https://www.mergado.sk/kategorie/aplikacie) 

25. 3. 2021

4 minúty čítania

 

 

 

 

 

  ![](https://www.mergado.sk/sites/default/files/perm/image/web-do-csv-scraping-camel.png)  

Chcete zo stránok či e‑shopov **získavať dáta**, ktoré nie sú obsiahnuté v XML feede? K cenným informáciám sa dostanete jednoducho pomocou novej aplikácie [Scraping Camel](https://store.mergado.com/detail/scrapingcamel/#about). Využite jej funkcie pre efektívnejšiu tvorbu *PPC reklám či SEO*. Ukážeme vám, ako na to.



 

 

 
                function tableOfContents() {
                  return {
                    headings_menu: [],
                    heading_active: '', // Added to track the active section
                    shouldBeSticky: false,

                    generateToC() {
                      const headings = document.querySelectorAll('.js-article-full-headings h2, .js-article-full-headings h3');
                      let headingMap = {};

                      headings.forEach((heading) => { // Use an arrow function to maintain `this` context
                        // Normalize heading text to remove diacritics, then replace non-alphanumeric characters with dashes
                        var normalizedText = heading.textContent.normalize("NFD").replace(/[\u0300-\u036f]/g, ""); // Remove diacritics
                        var id = heading.id ? heading.id : normalizedText.trim().toLowerCase()
                          .split(' ').join('-').replace(/[^a-z0-9\-]/ig, ''); // Updated regex to replace non-alphanumeric characters
                        headingMap[id] = headingMap[id] !== undefined ? ++headingMap[id] : 0;

                        // Use the updated `id` with diacritics removed for the heading id and the TOC
                        const finalId = headingMap[id] ? `${id}-${headingMap[id]}` : id;
                        this.headings_menu.push({
                          id: finalId,
                          title: heading.textContent,
                          level: heading.tagName.toLowerCase(), // Track heading level
                          active: false, // Initially set active to false
                        });
                        heading.id = finalId;
                      });
                    },

                    checkStickyNeeded() {
                      const ul = this.$el.querySelector('ul');
                      if (ul) {
                        this.shouldBeSticky = ul.scrollHeight < window.innerHeight;
                      }
                    },

                    setActiveHeading() {
                      // disabled not working with active state on click
                      // add @scroll.window="setActiveHeading()" to the parent div

                      // const headings = document.querySelectorAll('.js-article-full-headings h2');
                      // let activeHeading = '';
                      // let closestHeadingDistance = Infinity;

                      // headings.forEach((heading) => {
                      //   const rect = heading.getBoundingClientRect();
                      //   const offset = rect.top - window.innerHeight / 2; // Consider heading in the middle of the screen as active

                      //   if (offset < 0 && Math.abs(offset) < closestHeadingDistance) {
                      //     activeHeading = heading.id;
                      //     closestHeadingDistance = Math.abs(offset);
                      //   }
                      // });

                      // // Update the active state in headings_menu
                      // if (activeHeading !== this.heading_active) {
                      //   this.headings_menu = this.headings_menu.map(item => ({
                      //     ...item,
                      //     active: item.id === activeHeading,
                      //   }));
                      //   this.heading_active = activeHeading;

                      // }
                    },

                    setActiveItem(clickedId) {
                      this.headings_menu.forEach(item => {
                        item.active = (item.id === clickedId);
                      });
                      this.heading_active = clickedId; // Optionally update the heading_active property if used
                    },
                  };
                }
               1. <a :class="{ 'border-r-[3px] border-secondary': item.active, 'text-sm': item.level === 'h3' }" :href="'#' + item.id" class="inline-block text-balance hover:underline p-0.5 pr-3">  — </a>
  



 

Chcete zo stránok či e‑shopov **získavať dáta**, ktoré nie sú obsiahnuté v XML feede? K cenným informáciám sa dostanete jednoducho pomocou novej aplikácie [Scraping Camel](https://store.mergado.com/detail/scrapingcamel/#about). Využite jej funkcie pre efektívnejšiu tvorbu *PPC reklám či SEO*. Ukážeme vám, ako na to.

## Majte všetky potrebné informácie v jednom súbore

[Scraping Camel](https://store.mergado.com/detail/scrapingcamel/#about) je vyvinutý firmou *Shopitak*, ktorá sa zameriava na vývoj aplikácií pre ekosystém Mergada. Appka prechádza *HTML stránky webu* a získava z nich ľubovoľné informácie, ktoré uloží a vygeneruje z nich jeden **výstupný CSV súbor**. Vďaka tomu je appka vhodná pre kvalitné *dátové analýzy* produktov i kategórií.

[![](https://lh4.googleusercontent.com/vGUePmwgWA3fZMtIzVR-SCdK_pUWWsbWrCZgLI7B_iZ5iKGHnwCTH7_1br_EhqlnGzVB_yTJXqmIkzjfZNdY9IG8afe1n_GehsnRKms-ZNpnDTUgoSE33c_ubjAHiT6oSahHI5QR)](https://store.mergado.com/detail/scrapingcamel/#about)

Aplikácia dokáže spracovávať aj **weby,** **ktoré nie sú e‑shopmi.** Ide napríklad o rôzne *katalógy* (móda, cestovné kancelárie a pod.) *či webové prezentácie*. Ich dáta vie upraviť v Mergade pre *PPC reklamy Google Ads* či inak spracovať obvyklé postupy pro e‑shopy. V prípade, ak shopsystém užívateľa negeneruje XML (či iné) feedy, dokáže získať potrebné informácie a ďalej s nimi pracovať v [Mergade](https://www.mergado.sk/zaciname-s-mergadom) pre reklamné systémy.

Aké dáta môžete zo stránok získať? Pomocou aplikácie dostanete z webu **akékoľvek informácie,** ako napríklad *Title, Meta description, nadpisy H1 alebo H2, ID značky Google Analytics či Google Tag Manager.*

So [Scraping Camel](https://forum.mergado.cz/t/scraping-camel-news/1473) aplikujete pracovné postupy feed marketingu z e‑shopov s [XML feedmi](https://www.mergado.sk/tema/xml-feed) aj na weby bez nákupného košíka. Dáta sú priebežne automatizované a výstupy **dostupné online** pre ďalšie aplikácie či dátové napojenia.



 

  ![](https://www.mergado.sk/themes/custom/mergado/static/images/banner/mergado-store.svg) Stiahnite si celý web do jedného CSV

Scraping Camel vám prejde HTML stránky webu, získa z nich informácie, tieto informácie uloží a vygeneruje z nich jeden výstupný CSV súbor.

 

 [VYSKÚŠAŤ ZADARMO](https://store.mergado.com/detail/scrapingcamel/#about) 

  ![](https://www.mergado.sk/themes/custom/mergado/static/images/banner/mergado-store.svg)  

 

 [  ![](https://www.mergado.sk/sites/default/files/perm/paragraph-image/3f86499373c2936f9a74f32b78bd9fc8.png)  ](https://www.mergado.sk/sites/default/files/perm/paragraph-image/3f86499373c2936f9a74f32b78bd9fc8.png) 

### Ako funguje appka Scraping Camel

1. Definujte si **doménu**, ktorú má aplikácia prechádzať.
2. Vykonajte jej **overenie**, ktoré je podobné ako pri Google. Na výber máte z vloženia *súboru na web, META značky do stránok či DNS záznamu.* Cieľom je dokázať, že nejde o cudzí web.
3. Vložte *sitemap.xml*, ktoré je **podmienkou pre fungovanie aplikácie**. Scraping Camel tu berie [URL ](https://www.mergado.sk/tema/url-v-xml-feede)stránky webu.
4. Následne nastavte **frekvenciu** prehliadania stránok webu – príliš veľa dotazov môže web preťažiť a málo naopak spomaliť spracovanie celého webu.
5. Ďalej zvoľte, aké **elementy** chcete získavať z cieľových HTML stránok. Predvolené sú *title, meta description* alebo si nadefinujte *vlastné elementy* (prostredníctvom [regulárneho výrazu](https://www.mergado.sk/workshop-regularne-vyrazy-v-mergade) alebo uvedením textu pred a za hľadanými informáciami).
6. Nastavte si, ako sa majú **menovať elementy** so získanými informáciami vo výstupnom [CSV](https://www.mergado.sk/tema/csv).
7. V závere začne aplikácia prechádzať cieľový web. Až ho celý spracuje, **vygeneruje výstupné CSV** a v administrácii uvedie jeho adresu.



 

**Detailný postup** nastavenia aplikácie nájdete v tejto [dokumentácii](https://info.scraping-camel.cz/).

 

 

 

 

 

### Použitie aplikácie Scraping Camel

Na testovacom e‑shope vám ukážeme, ako jednoducho získate SEO dáta a popis produktu.



 

- ### 1. Kliknete na záložku “Upraviť elementy” 
    
      
    
     
    
     ![](https://lh4.googleusercontent.com/OrCCVsgcF5SXmYXAP1U28dJzt6KgYP-FbfHuqaQ4n0J70P4_vtbST7jRFoEaK1KIrg-9u8QTheno05eXNh0ETDi4HuB8OCo9LPbJOQpKcFuJaGW7hfYpG99YyKUFNmxzxLmyF2Ix)
- ### 2. Kliknite na “Pridajte vlastný element” a elementy si pomenujte podľa vašich preferencií 
    
      
    
     
    
     ![](https://lh5.googleusercontent.com/N_JlzjcI9FtM99E_SIHJvAEVoYYYX_8nfls2qUCgb24phnodpPa6UQMaMPPfp2LFOn3q4bb9jlUEHlhmUmigjL9gTgiEY4UfRNI8D7kQal3l8YtEKUALxPMlWiTehWtCpxaQVUoI)
- ### 3. Prejdite na váš web, z ktorého chcete získať dáta a stlačte kláves CTRL+U 
    
      
    
     
    
     
    - Táto klávesová skratka vám umožní vidieť **zdrojový kód webu**, ktorý potrebujete k nadefinovaniu elementov. Alebo môžete kliknúť na pravé tlačidlo myši a takto zobraziť zdrojový kód stránky.
    - Pomocou klávesovej skratky CTRL+F *(slúži na vyhľadávanie obsahu na danej stránke*) zadajte **požadovaný element**, ktorý chcete získať. V tomto prípade chceme nájsť popis produktu, teda: &lt;h3&gt;Detailný popis produktu&lt;/h3&gt;
    
    ![](https://lh4.googleusercontent.com/64Zue00zDW37dsAnDC_M9aK0RXhIK0kUAZbbKeWrpF_sr55jm7XknFnbQaNyUeEAkLnvl4SgfIh6rlJrjM0P4q3RdDwKauQNdqe4evvW8fBiU8X_9OIaBS1dWBop7ECKUWwTZGNI)
- ### 4. Prejdite späť do aplikácie Sraping Camel
    
      
    
     
    
     Do “Hodnoty predtým” zadáte: &lt;h3&gt;Detailný popis produktu&lt;/h3&gt; a do “Hodnoty pod” zadáte &lt;/​div&gt;. Vyzerať to bude nasledovne:
    
    ![](https://lh3.googleusercontent.com/tR5spPLHTbfLDdbdC1qg-t5ktjfr29Y6P5K_FWPGfGblsWgmx0u-zcrjovaOEpPEq_WOCNXbphdpsRi1lsTR0ahFHWQyYn7Cg_69cgAC5m4zcbPF-89CU6-ArPN5j6r68PF7IUIF)
- ### 5. Výsledok
    
      
    
     
    
     Aplikácia primárne neslúži na prezeranie dát, myslite na to. Odporúčame, aby ste dáta prezerali v inom programe, napríklad v *Mergade alebo Google Sheet*. Rovnaký postup aplikujte aj na ostatné prvky, ktoré chcete z webu získať.
    
    ![](https://lh6.googleusercontent.com/s33JlHLaOBXeBa7Y6VaT8ncneTMc1Z0q4FZiQ_zholfl5xr4pieu0rtxhwAXXlT5xsWrn1ItUgfiaEGEARY366lWh8OmTzcB_vTzQRNbhGWabtvPdsyvHqAbPuyELfRyc5ssLxTG)
 
 

 

[Scraping Camel ](https://info.scraping-camel.cz/)**pravidelne a automaticky kontroluje** cieľový web. Ak nájde novú stránku, ihneď ju spracuje a prípadné zmeny premietne vo výstupnom CSV súbore.

Aplikáciu využijú nielen e‑shopári. Do CSV súboru dokážu načítať **informácie o tovare či službe** zo stránky bez feedu aj marketéri, špecialisti na [SEO](https://www.mergado.sk/tema/seo) alebo PPC reklamu.



 

Aké sú **rozdiely** aplikácie oproti iným nástrojom? Programy ako *Screaming Frog* či *Xenu* fungujú na jednorazovom princípe a spúšťajú sa na lokálnom zariadení. Scraping Camel pracuje presne naopak – **beží na serveri a to nonstop**. Výstupy poskytuje v *strojovo čitateľnej podobe*, ktoré dokážete ďalej aj strojovo spracovávať. Využijete ho tak k **jednorazovým analýzam**, kde dáta automaticky spracuje ďalším softvér.

### **Zhrnutie**

**Výhody** **aplikácie Scraping Camel:**

- neustály monitoring zmien
- funguje na serveri (*non-stop*)
- možnosť nahrať do [Mergada](https://www.mergado.sk/mergado-sikovny-spravca-produktovych-feedov) ako vstupný súbor pre export a s týmto ďalej pracovať obvyklým spôsobom
- *neobmedzený počet* webov na jeden účet

**Čo potrebujete vedieť:**

- nevykresľuje *JavaScript,* funguje iba na základe HTML
- princíp extrakcie dát, je *na základe znakov*, nie na základe elementov
- podmienkou pre používanie Scraping Camel je *funkčný súbor sitemap a overená doména*

Vyskúšajte si funkcie Scraping Camel naplno na **30 dní zadarmo** a zúročte výhody kvalitne získaných dát.



 

- [  Scraping Camel ](https://www.mergado.sk/tema/scraping-camel)
 
 [    ![](https://www.mergado.sk/sites/default/files/perm/image/profil-foto.jpg)  ](https://www.mergado.sk/blog/petra-markova)###  [ Petra Marková ](https://www.mergado.sk/blog/petra-markova) 

Slovenský trh a ľubozvučnú slovenčinu má v Mergade na starosti content špecialistka Petra. Textuje, bloguje, prekladá a s vášňou tvorí obsah na sociálne siete. A keď práve nehľadá tie správne slová, venuje svoj čas bytovej džungli, pečeniu, kaviarňam alebo cestovaniu.

 

 

 

 

 

 

 

 

 

## Mohlo by vás *zaujímať*

 

 [    ![](https://www.mergado.sk/sites/default/files/perm/image/gpsr-sprievodca.png)  

### Ako na GPSR pre Allegro a Kaufland: S týmto sprievodcom sami doplníte e‑shop o požadované údaje

 

 ](https://www.mergado.sk/blog/gpsr-allegro-kaufland) 

 [    ![](https://www.mergado.sk/sites/default/files/perm/image/zobrazovanie-alternativnych-produktov.png)  

### Zobrazujte najvhodnejšie alternatívne produkty. Nakúpi u vás viac zákazníkov

 

 ](https://www.mergado.sk/blog/alternativne-produkty) 

 [    ![ice cat produktový katalog ](https://www.mergado.sk/sites/default/files/perm/image/ice_cat_katalog_clanok_sk.png)  

### Katalóg Icecat vám pomôže doplniť chýbajúce produktové dáta. S Mergadom ho prepojíte aplikáciou Clicking Goat

 

 ](https://www.mergado.sk/blog/icecat-clicking-goat-doplnte-chybajuce-data) 

 

 

 

## Nenechajte si nič *ujsť*

 Prihláste sa k odberu nášho newslettera 

   

       

   Prihlásením súhlasíte s tým, že vaše údaje budeme spracovávať v súlade s našimi [zásadami ochrany osobných údajov](https://www.mergado.sk/vyhlasenie-o-cookies). 

  Ďakujeme, úspešne ste sa pripojili k nášmu zoznamu odberateľov. 

 

 

 
      function ml_webform_success_5807248() {
        var r = ml_jQuery || jQuery
        r('.ml-subscribe-form-5807248 .row-success').show(), r('.ml-subscribe-form-5807248 .row-form').hide()
      }