* РБК — новости

* *

Как использовать YourText.guru с R?

  1. Презентация YourText.guru
  2. Получи свой токен
  3. Установите мой пакет R
  4. Создать руководство
  5. Получить семантические оценки по URL
  6. Совет Сиу
  7. Получить семантические оценки по нескольким URL
  8. заключение

Этим летом у меня была возможность протестировать YourText

Этим летом у меня была возможность протестировать YourText.guru и Cocon.se, оба инструмента известны и полезны для оптимизации SEO его или ее веб-сайтов.

Чтобы обслуживать людей, которые занимаются R и SEO, я создал первый пакет R, который позволяет вам легко манипулировать API этих программ.

Я начну с того, что представлю вам YourText.guru и пакет R с открытым исходным кодом, специально созданный для этого случая:

https://github.com/voltek62/writingAssistantR

Если вы предпочитаете Python, Жюльен Деневиль предлагает эту версию: https://gitlab.com/databulle/python_ytg

Презентация YourText.guru

YourTextGuru - это служба, которая создает руководства по написанию справки по сравнению с запросом ввода, чтобы сэкономить ваше время и повысить качество.

Эти руководства генерируются благодаря двум алгоритмам:

  • Имитация обработки, сделанной поисковиком по актуальности текстов
  • Получение связанного текста и определение наиболее важных ключевых фраз.

Имитация обработки, сделанной поисковиком по актуальности текстов   Получение связанного текста и определение наиболее важных ключевых фраз

Получи свой токен

Чтобы использовать пакет R, вы должны иметь доступ к API 100 € / месяц на момент написания этой статьи.

Просто перейдите на эту страницу, чтобы узнать свой ключ API: https://yourtext.guru/profil/api

guru/profil/api

Этот ключ должен быть скопирован в корень вашего проекта в текстовом файле: ytg_configuration.txt

маркер = VOTRECLEAPI
отлаживать = FALSE

Установите мой пакет R

Чтобы использовать пакет R, вы должны иметь Rstudio и иметь базовые навыки.

Я приглашаю вас написать эти строки в консоли.

библиотека (devtools) install_github ("voltek62 / writingAssistantR")

Чтобы инициализировать пакет, вам просто нужно использовать следующий код, остерегайтесь функции initAPI, которая прочитает ваш токен в вашем текстовом файле "ytg_configuration.txt"
Функция getStatus просто проверяет правильность соединения.

библиотека (RCurl) библиотека (rjson) библиотека (XML) initAPI () статус <- getStatus ()

Создать руководство

Чтобы создать руководство, это очень просто, вы должны указать свой запрос , язык (здесь: en_fr) и нужный режим руководства :
- Премиум руководство предназначено для предоставления списка всех важных и важных слов, связанных с запросом.
- Руководство Oneshot предназначено для предоставления шаблона для написания текста объемом около 300 слов.

Я поставил цикл, который ожидает окончания создания руководства, это может занять несколько минут.

guide <- createGuide ("crossfit", "fr_en", "premium") guide_id <- guide $ guide_id while (getGuide (guide_id) == "error") {print ("Ваше руководство в настоящее время создается.") Sys. sleep (40)} print («Ваш гид готов») guide.all <- getGuide (guide_id)

Получить семантические оценки по URL

С пакетом R это очень просто, вам просто нужно указать свой URL и ранее созданный номер руководства.

url <- "http://www.wodnews.com" баллы <- checkGuide (guide_id, url)

Вы получите две оценки:
- soseo: общая оценка текста, представленного с точки зрения оптимизации (100% соответствует оптимизированному тексту в максимуме зоны нормальности).
- dseo: оценка риска SEO. Это процент, который в некоторых крайних случаях может превышать 100%.

Совет Сиу

Я протестировал несколько советов, чтобы непосредственно восстановить основной текст страницы.
Наилучший метод - использовать XPath со следующим запросом.

// текст () [нет (предок :: выберите)] [нет (предок :: сценарий)] [нет (предок :: стиль)] [нет (предок :: NoScript)] [нет (предок :: форма)] [длина строки (.)> 10]

Если вы хотите пойти дальше по этой теме, я предлагаю вам прочитать: (Большое спасибо тем, кто консультирует меня через Twitter)
- https://moz.com/devblog/benchmarking-python-content-extraction-algorithms-dragnet-readability-goose-and-eatiht/
- https://boilerpipe-web.appspot.com/

# скачать html html <- getURL (url, followlocation = TRUE) # анализ html doc = htmlParse (html, asText = TRUE) plain.text <- xpathSApply (doc, "// text () [not (ancestor :: select) ] [not (ancestor :: script)] [not (ancestor :: style)] [not (ancestor :: noscript)] [not (ancestor :: form)] [string-length (.)> 10] ", xmlValue ) txt <- вставить (plain.text, collapse = "")

Получить семантические оценки по нескольким URL

Я даю вам метод с Rvest, чтобы восстановить первые 100 результатов в Google, но есть тысячи методов.

библиотека (rvest) библиотека (httr) библиотека (stringr) библиотека (dplyr) запрос <- URLencode ("crossfit france") страница <- paste ("https://www.google.com/search?num=100&spv=2&btnG= Поиск & q = ", query," & start = 0 ", sep =" ") # Один выполняет запрос на веб-странице Google <- read_html (page) # При извлечении тегов A для каждого результата googleTitle <- html_nodes (webpage, "h3 a") goTextText <- html_text (googleTitle) #Удалить ссылки hrefgoogleTitleLink <- html_attr (googleTitle, "href") #On clean googleTitleLink <- str_replace_all (hrefgoogleT? . *) "" «)

Теперь интересно просмотреть этот набор данных и получить оценки для каждого из URL-адресов.

библиотека (dplyr) DF <- data.frame (Title = googleTitleText, Link = googleTitleLink, Score = 0, опасность = 0, stringsAsFactors = FALSE)%>% фильтра (grepl ("http", Link)) для (я в 1 : nrow (DF)) {ссылка <- DF [i,] $ Оценка баллов <- checkGuide (guide_id, ссылка) if (scores! = "error") {DF [i,] $ Score <- оценка $ оценка DF [ я,] $ опасность <- оценивает $ опасность} наконец = Sys.sleep (60)

Вы получите таблицу с оценкой для каждого из URL.

заключение

Здесь я надеюсь, что вам будет полезно проанализировать свой контент и контент конкурентов.

Я думаю, что если вам нужно создавать контент, важно использовать инструмент для написания, например yourtext.guru, потому что он предназначен для нужд SEO, редакторов и веб-маркетологов.

В августе я готовлю следующую статью: Как использовать Cocon.se с R?

Com/search?
HrefgoogleT?
Se с R?

Реклама

Популярные новости


Реклама

Календарь новостей

Реклама

Архив новостей

Реклама