Перейти к содержанию
СофтФорум - всё о компьютерах и не только

Программное решение одной проблемы с текстами


Рекомендуемые сообщения

Добрый всем день. Я занимаюсь размножением текстов(когда с помощью специального шаблона из одной статьи получается 50-100 статей и более). Практически в каждом заказе требуется простановка ссылок с соответствующим анкором. Обычно даются 5-10 ссылок с пометкой "чередование", я вношу ссылки в программу и она автоматически проставляет их в размноженных текстах. Проблем нет. Но нередко встречаются более сложные заказы, где требуется одно из следующих:

1) дано 10 ссылок, нужно первую ссылку в первой статье использовать, вторую во второй и так далее, а потом по новой

2) нужно размножить текст на 100 копий и на каждую копию дана уникальная ссылка(при проставлении ссылок программой она может одну ссылку использовать два раза, а другую вообще не использовать, потому программа тут не подходит)

3) самый трудный вариант: для каждой размноженной статьи уникальная ссылка(или по ссылке на две статьи) и нужно ещё, чтобы в тайтле или h1 встречался анкор ссылки. Т.е. если ссылка идёт с анкором "купить окна", то и в названии должно фигурировать "купить окна".

с первым вариантом более менее справляюсь, но вот 2ой и 3ий вариант приходится делать вручную, т.е. в каждую статью ручками добавлять ссылку и т.д. Обычно заказы идут на 100 и более статей, поэтому это очень муторно и долго, плюс могут возникнуть ляпы и их не сразу найдёшь.

Я пользовался несколькими программами для размножения текстов(Generation the Web, Monkey write, Article clone easy), но не в одной нет возможности для реализации выше озвученных вариантов. Посему ищу иной способ. Может быть какая-нибудь программа для массового редактирования текстов или скрипт.

У меня есть задумка, но я не знаю как её реализовать практически. А задумка заключается в следующем: делается две папки с файлами пронумерованными от 1 и до нужного. В одной папке идут файлы со статьями, в другой папке - файлы с ссылками. В каждой статье в определённом месте размещён какой-нибудь код или слово. Далее программа или скрипт берёт ссылку из первого файла ссылок и заменяет указанный код или слово в файле с первой статьёй, потом вторая ссылка во втором файле со статьёй и т.д.

Может кто-нибудь знает, как это сделать? Готов заплатить денежное вознаграждение за скрипт или нечто такое, что поможет. Или может знаете место, где могут помочь, может какой-нибудь специализированный форум? Заранее спасибо!

Ссылка на комментарий
Поделиться на другие сайты

Можешь образец какой-нибудь привести, не совсем понимаю что нужно сделать, куда ссылки проставлять и т.п.

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...

kvazimoda, приготовил пример того, что мне нужно

Приведу пример того, что мне нужно на приложенном архиве Sample 1.

Имеется две папки: статьи и ссылки. В папке «статьи» 10 txt файлов, в каждом из которых по тексту. Файлы имеют название статья 1.txt, статья 2.txt и т.д. В папке «ссылки» так же 10 txt файлов, в каждом файле ссылка в виде < a href=””></a>. Файлы с ссылками имеют название ссылка 1.txt, ссылка 2.txt и т.д.

В каждой статье во втором абзаце имеется слово <ссылка>(с боковыми кавычками). Мне нужно, чтобы программа(или что-то другое) заменяло данное слово <ссылка> на текст ссылки из файлов в папке «ссылки». Т.е. я имею ввиду следующее:

Из файла ссылка 1.txt берётся текст ссылки < a href="http://site.ru">ссылка</a> и вставляется в файл статья 1.txt вместо <ссылка>;

<ссылка>

Из файла ссылка 2.txt берётся текст ссылки < a href="http://site.ru">ссылка</a> и вставляется в файл статья 2.txt вместо <ссылка>;

<ссылка>

Из файла ссылка 3.txt берётся текст ссылки < a href="http://site.ru">ссылка</a> и вставляется в файл статья 3.txt вместо <ссылка>;

<ссылка>

И так далее во всех файлах. Очень важно, чтобы ссылка бралась из файла и вставлялась в файл со статьёй с таким же номером. Т.е. никаких «Из файла ссылка 1.txt в файл статья 3.txt».

P.S. Не обязательно, чтобы все ссылки находились в разных файлах. Будет даже лучше, если все ссылки будут в одном файле и программа будет брать первую ссылку, вставлять в первый текст, вторую ссылку во второй текст и т.д.

sample 1.7z

Вот файл для примера

sample 1.7z

sample 1.7z

sample 1.7z

Ссылка на комментарий
Поделиться на другие сайты

В принципе, задача примитивная. Могу такое написать на питоне.

Вопрос в том, как именуются файлы, они всегда будут с порядковым номером или это только для образца ты так сделал? Просто вопрос на самом деле в том, как достоверно соотнести ссылку со статьёй. Я думаю сделать тупо сортировку файлов статей по алфавиту в сторону от "А" до "я", также можно сортировать файлы с ссылками, либо брать из файла по одной строке по очереди.

Второй вопрос, если я это тебе напишу на питоне, то в винде надо будет приложить некоторые усилия, чтобы это запустить, т.к. изначально питона в винде нет. Т.е. тебе придётся его установить. И там будет немного подругому сортировка работать, хотя если есть порядковый номер... Но номер тогда должен быть вида 001, 002...576,577, чтобы однозначно сортировалось, а то винда любит сортировать "по-человечески".

Ссылка на комментарий
Поделиться на другие сайты

kvazimoda, я это сделал для образца, можно даже, чтобы файлы шли 001, 002, 003 и т.д. - чисто порядковый номер.

А можно немного усложнить процесс? Тот же самый смысл, только кроме ссылок в каждую статью в определённое место(так же с заменой какого-либо слова) шли ещё слова или словосочетания из других файлов. Т.е. из папки с файлами ссылок достаются тексты ссылок и помещаются в статью, из других папок из файлов берётся текст и помещается в заголовок, середину, конец статьи и т.д.

Большое спасибо за то, что решили помочь!

Ссылка на комментарий
Поделиться на другие сайты

А можно немного усложнить процесс? Тот же самый смысл, только кроме ссылок в каждую статью в определённое место(так же с заменой какого-либо слова) шли ещё слова или словосочетания из других файлов. Т.е. из папки с файлами ссылок достаются тексты ссылок и помещаются в статью, из других папок из файлов берётся текст и помещается в заголовок, середину, конец статьи и т.д.

Ну, тут вопрос в другом, что сделать то можно всё что угодно, только если так "усложнить" процесс, то как объяснить программе что на что менять? Может тогда в том файле с сылками указывать ключевое слово и на что менять? Просто тут возникает вопрос, кто будет подготавливать это всё для программы, не будет ли это сложнее, чем вручную всё это подставлять? :)

Большое спасибо за то, что решили помочь!

Ну, помочь то я не против, вопрос только в том, что писать я это буду довольно долго, может пару недель, т.к. и работы много, и язык не настолько хорошо знаю, т.е. ещё учусь.:)

Изменено пользователем kvazimoda
Ссылка на комментарий
Поделиться на другие сайты

Может тогда в том файле с сылками указывать ключевое слово и на что менять?

Можно и так. Мне главное, чтобы в каждую статью была помещена определённая ссылка(ссылки), ключевые слова в заголовок, середину и конец. Может в один файл всё или сделать несколько отдельных файлов(файл с ссылками, файл с ключевыми словами) и прогонять несколько раз статьи.

Просто тут возникает вопрос, кто будет подготавливать это всё для программы, не будет ли это сложнее, чем вручную всё это подставлять?

Мне так нужно обработать более 100 статей(в среднем по 130), потому если вручную, то уходит по 2-3 часа, потому этот вариант не подходит :)

Ссылка на комментарий
Поделиться на другие сайты

@Killua,

1) куда в середину вставлять - в место, где есть ключевое слово? типа #ref001

2) в начало и конец - точно в начало и конец или как?


Могу сделать так

файл со списком ссылок в начале строки символ ссылки. Примерно так

#ref001#<a href="http://site1.ru">ссылка</a>#ref002#<a href="http://site2df.ru">ссылка</a>#ref003#<a href="http://site3.ru">ссылка</a>#ref004#<a href="http://sitaaee4.ru">ссылка</a>#ref005#<a href="http://site5.ru">ссылка</a>#ref006#<a href="http://site6.ru">ссылка</a>#ref007#<a href="http://sitwere7.ru">ссылка</a>#ref008#<a href="http://sittye8.ru">ссылка</a>#ref009#<a href="http://sitffgfge9.ru">ссылка</a>#ref010#<a href="http://sitdfhhge10.ru">ссылка</a>

Выбираешь папку со статьями

Программа в этой папке все текстовые файлы перебирает и если находит набор символов, скажем #ref002# заменяет его на ссылку т.е. <a href="http://site2df.ru">ссылка</a>

в любом месте где, поставишь. Можно несколько ссылок и можно в любом количестве.

Идет?

Изменено пользователем Teddy_Bear
Ссылка на комментарий
Поделиться на другие сайты

Teddy_Bear, да, что-то вроде этого. Только в таком случае опять же придётся вручную проставлять ключевые слова #ref001# и другие в статьи, дабы в каждую статью была вставлена уникальная ссылка. У меня идёт целый список уникальных ссылок(100 штук к примеру) и нужно, чтобы в каждую статью была вставлена уникальная ссылка по порядку, т.е. в первую статью первая ссылка, во вторую статью вторая ссылка и т.д. Или может тогда так: как-либо программой проставить в каждую статью ключ #ref001#, #ref002# и т.д., а потом их уже заменить на ссылки? Спасибо за помощь

Ссылка на комментарий
Поделиться на другие сайты

Давайте я немного дополню информацией, дабы было яснее, что мне нужно.

В папке расположено 100 статей, каждая статья в отдельном файле. В статье идёт в начале название, потом абзац текста, далее заголовок в теге <h1>, далее в середине статьи заголовок в теге <h2>.

Даётся список ссылок с ключевыми словами, ссылок 200 штук(с уникальными ключевыми словами), необходимо в каждую статью поместить по 2 ссылки, одна в первом абзаце, другая в середине статьи(можно в одном и том же месте).

Мне требуется следующее:

1) проставить в каждую статью по 2 уникальных ссылки(чтобы не повторялись)

2) добавить ключевые слова от ссылок в название статьи, в заголовок <h1> и заголовок <h2>. Т.е. если в тексте идёт две ссылки: <a href=site.ru>купить пластиковые окна</a> и <a href=site.ru>окна rehau</a>, то в названии и в заголовке <h1> должны быть вставлены эти два ключевых слова ("купить пластиковые окна", "окна rehau"), а в заголовок <h2> только ключевое слово от второй ссылки ("окна rehau"). И так в каждой статье

Ссылка на комментарий
Поделиться на другие сайты

Наваял пока так, как понял. Щаз попытаюсь переделать под твоё ТЗ.

Inserter.7z

У тебя Html ? А то я под txt сделал. Хотя можно под любые расширения, хотя текстовые по сути. Только надо, чтобы в папке не было нетекстовых файлов.

Извини, в ТЗ так и не въехал.

Не пойму, как установить соответствие между ссылками, которые нужно вставить и статьями.

Допустим, просто по порядковому номеру, но тогда паре ссылок из списка - одна статья?

Второе - середина статьи - это как-то неопределённо.

если в тексте идёт две ссылки: <a href=site.ru>купить пластиковые окна</a> и <a href=site.ru>окна rehau</a>, то в названии и в заголовке <h1> должны быть вставлены эти два ключевых слова ("купить пластиковые окна", "окна rehau"), а в заголовок <h2> только ключевое слово от второй ссылки ("окна rehau").

То есть ссылки уже есть в статьях? Их только надо добавить в заголовки в тегах <h1> и <h2>?

Или путаница в терминологии. Давай есть список ссылок и набор статей, куда вставляем.

Inserter.7z

Изменено пользователем Teddy_Bear
Ссылка на комментарий
Поделиться на другие сайты

Запости конкретный пример, чтобы с тегами и ссылками. Содержание можно почикать - оно не к чему мне. Надо чтобы структура документов сохранилась. Теги, соответствие названий ссылок (тоже можешь сократить, чтобы не палить, но одинаково), ну и т.п. В твоем примере sample 1.7z тегов не было.

Тогда так: паре ссылок в списке ссылок - одна статья. Порядковый номер соблюдать - твоя головная боль. Ведь негоже в статью про пластиковые окна рекламу автомобилей. Или можно мешать - тема одна?

Вставка в заголовок статьи - перед </title> что ли?

Вставляем в две ссылки в конец тега перед </h1> и вторую в конец тега </h2>.

В первый абзац - средний пробел в первом теге <p> вставляем первую ссылку

В середину статьи - выбираем средний тег <p> и также как в первый, только вторую ссылку.

Так?

Изменено пользователем Teddy_Bear
Ссылка на комментарий
Поделиться на другие сайты

@Teddy_Bear, я уже сам запутался)

К сообщению прикладываю файл, там идут уже готовые статьи в архиве(то что должно получиться на выходе) и файл с ТЗ. В ТЗ описано, что и где должно находиться

пример.7z

пример.7z

Изменено пользователем Killua
Ссылка на комментарий
Поделиться на другие сайты

Гм.

Сударь Killua... А вам не случалось подумать о действительной необходимости подобного "размножения" текстов? Или о хотя бы обучении хоть чему-то, перед тем как за подобное "творчество" браться?

P.S. Оно не в упрёк - есть гораздо более поганые способы копеечку срубить. Это просто так - для размышления... Возможного.

Ссылка на комментарий
Поделиться на другие сайты

Сам почти так подхалтуриваю. В Excel сдалал проект узла учета тепловой энергии с чертежами настраиваемый по параметрам. Достаточно заполнить таблицу исходных параметров, нажать кнопочку и проекты готовы. Беру не "числом, а количеством" :) Расценки ниже плинтуса, но ввиду большого числа нормально выходит.

Сейчас посмотрю пример.


Теперь понятно.

1) Выбираем ссылки довольно произвольно из двух списков. Вставлять две ссылки произвольно, но вопрос - не надо ли привязывать их к контексту статьи.

Если привязывать, то это ручная работа. Впрочем можно вставлять программой, а потом уже обработать по месту, притянув за уши.

2) В теги title, h1 и h2 добавляем текст ссылки без самой ссылки - без проблем.

3) Там предлагается вставлять картинки со ссылками и описаниями (тег alt)

Cписок картинок ты мне не описал в ТЗ. Его надо создавать дополнительно?

4) Не понятно что с выделениями предложений strong и em - не надо что ли?

Если уж делать, то до конца.

Как это у Галича: "Ты ж советский, ты же чистый как кристалл - начал делать, так уж делай чтоб не встал!" :)

Изменено пользователем Teddy_Bear
Ссылка на комментарий
Поделиться на другие сайты

@Yezhishe, я не вижу смысла в вашем сообщении. Я работаю фрилансером в фирме, пишу и размножаю тексты. Клиенты довольны, деньги платят. Я создал эту тему, дабы решить проблему с некоторыми особо сложными заказами, дабы сократить время, затрачиваемое на них и количество ошибок.

Изменено пользователем Killua
Ссылка на комментарий
Поделиться на другие сайты

Так я же сказал и повторяюсь - "не в упрёк". Каждый выбирает свою дорогу...

Мне, правда, почему-то всегда казалось, что писать свои тексты - это почётно и правильно, а использование чужого с минимальными переделками - презренно... Но, за последние годы, судя по всему, нравственные ценности сместились.

Ссылка на комментарий
Поделиться на другие сайты

1) Выбираем ссылки довольно произвольно из двух списков. Вставлять две ссылки произвольно, но вопрос - не надо ли привязывать их к контексту статьи.

В основном ссылки идут с ключевыми словами более менее одинаковыми(переставленные слова, названия моделей на русском и на английском. К примеру: ключ "Mazda" и ключ "Мазда"), потому в таком случае они в контекст вставляются нормально и по смыслу. Там где иные ключевые слова("Мазда" и "Купить Мазду") - буду править ручками.

3) Там предлагается вставлять картинки со ссылками и описаниями (тег alt) Cписок картинок ты мне не описал в ТЗ. Его надо создавать дополнительно?

Виноват, про картинки совсем забыл. С ними такая ситуация: даётся несколько картинок, их необходимо вставить в текст так, чтобы в alt было ключевое слово от 2ой ссылки и на картинке было то, что написано во второй ссылке. Т.е. если вторая ссылка идёт с ключом "BMW X5" или "Купить BMW X5", то на картинка должна быть эта модель.

Я данные картинки подготавливаю отдельно таким образом: идёт список отдельный, в нём идёт блок ссылок под каждую статью: первая ссылка, вторая ссылка и картинка ко второй ссылке и по новой. Я беру первый блок, вставляю в первую статью, потом беру второй блок и вставляю во вторую статью.

4) Не понятно что с выделениями предложений strong и em - не надо что ли?

В strong нужно вставить анкор от первой ссылки, в em - анкор от второй ссылки. Не хотел просто нагружать вас, потому представил ТЗ, где только нужно вставить ссылки и слова в заголовки.

@Yezhishe, не беспокойтесь, тексты написаны моими руками и из своей головы. Буду очень признателен, если сможете чем-нибудь помочь в разрешении данной проблемы.

Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...