Владимир Игоревич Баканов в Википедии

О школе Конкурсы Форум Контакты Новости школы в ЖЖ мы вКонтакте Статьи В. Баканова
НОВОСТИ ШКОЛЫ
КАК К НАМ ПОСТУПИТЬ
НАЧИНАЮЩИМ
СТАТЬИ
ИНТЕРВЬЮ
ДОКЛАДЫ
АНОНСЫ
ИЗБРАННОЕ
БИБЛИОГРАФИЯ
ПЕРЕВОДЧИКИ
ФОТОГАЛЕРЕЯ
МЕДИАГАЛЕРЕЯ
 
Olmer.ru
 



 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация   ПрофильПрофиль 
 Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Статистика текста

 
Начать новую тему   Ответить на тему    Список форумов Школа перевода В. Баканова -> Полезные и интересные ссылки
Предыдущая тема :: Следующая тема  
Автор Сообщение
vmb


Зарегистрирован: 14.02.2010
Сообщения: 390

 

СообщениеДобавлено: Сб Мар 13, 2010 6:41 pm    Заголовок сообщения: Статистика текста Ответить с цитатой

[Текст устарел, поэтому удалён. Описание новой версии здесь.]

Последний раз редактировалось: vmb (Чт Апр 29, 2010 9:12 pm), всего редактировалось 8 раз(а)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
vmb


Зарегистрирован: 14.02.2010
Сообщения: 390

 

СообщениеДобавлено: Вс Мар 14, 2010 1:51 pm    Заголовок сообщения: Ответить с цитатой

Добавлены:

- подсветка зияний и скопления согласных;
- подсветка местоимений и глаголов-связок;
- список слов, отсортированных по длине.

Звукосочетания из таблицы переместились в текстовый блок, для наглядности.

Описание в шапке обновлено.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Ирма


Зарегистрирован: 20.01.2008
Сообщения: 1578

 

СообщениеДобавлено: Вс Мар 14, 2010 6:00 pm    Заголовок сообщения: Ответить с цитатой

Забавная штука. Только туда бы помимо "свой" добавить ещё их, её, его и прочие ним, нею и т.д. Себя, меня, мне, мной и пр.

И ещё там, туда, оттуда и т.д., начинающие часто на них спотыкаются - "полез в шкаф и достал оттуда", "посмотрел за окно и увидел там" (то есть понятно, что лучше просто "достал из шкафа" и "увидел за окном", но хотя бы так). Кстати, "так", "такой" и т.д. тоже туда же. И ещё "вот".

Ну если заморачиваться, то можно ещё выделять, например, однокоренные слова, встречающиеся в пределах двух десятков слов друг от друга Smile - программа потянет? А то много чего можно вспомнить при случае Smile.

Два и более инфинитива подряд, например, потянет? (Только там придётся отсекать слова типа "жесть", "снасть" и т.д.) А если не подряд, а через слово? И одинаковые предлоги в пределах трёх-четырёх-пяти слов друг от друга (отслеживать фразы типа "шёл дождь и два студента, один в пальто, другой в университет, один по тротуару, другой по поручению, один под зонтиком, другой под надзором полиции. Они зашли в кафе, и один пил чай с сахаром, а другой с удовольствием").

Да, и окончания "ся" и "сь" выделять бы, но чтобы оно не помечалось в середине слов типа "всякий" или "лисье" и не путалось со словами типа "весь" или "Вася".

И если наберётся много критериев, могут понадобиться разные цвета заливки для разных выборок, чтоб не путаться, - это реально?

Вы, похоже, влипли в долгосрочный проект Smile.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
vmb


Зарегистрирован: 14.02.2010
Сообщения: 390

 

СообщениеДобавлено: Вс Мар 14, 2010 6:17 pm    Заголовок сообщения: Ответить с цитатой

Ирма
Конечно, там многое нужно бы добавить, просто это была поделка на коленке, даже не знаю пока, буду ли развивать.

Тут ведь есть и другая опасность: если добавить очень много всего, выйдет путаница, машина ведь не станет объяснять своих действий, она не редактор. Нужно будет под каждый критерий выделять отдельный экземпляр текста, потому что цветовой винегрет тоже не всегда удобно читать.

Может быть, в будущем добавится возможность самому пользователю определять «группу риска», перечислением словоформ или регулярными выражениями.

Ещё можно случайные рифмы искать, но это тоже непросто формализировать, а подключать базу ударений -- выйдет монстр, который в один файл не уместить (сейчас всё в одной страничке, можно просто сохранить и пользоваться локально).

Это никогда не станет академическим проектом, у меня нет достаточных знаний, ни филологических, ни программистских. Да и подход должен быть другой: с выделенным сервером, с базами данных, писать нужно на языках, исполняемых на сервере, а не в браузере, а я таким никогда не занимался.

Скорее всего, это такой однодневный проект для Science Fair :)

Хотя по себе знаю: напишешь такую ерунду для развлечения, а потом теряешь сон и аппетит, надстраиваешь этаж за этажом. Но я буду бороться, авось эта русалка меня не утащит. Хотя, понимаю, многим хотелось бы, чтобы утащила))
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
fluffy


Зарегистрирован: 14.04.2009
Сообщения: 53

 

СообщениеДобавлено: Вт Мар 16, 2010 5:03 am    Заголовок сообщения: Ответить с цитатой

отлично! прямо на собственном конкурсном отрывке и проверила. работает эта ваша программка, что я могу сказать! 6 "был/а/о/и", 6 "но" и 23 "и"! мама дорогая! списать на стилизацию деской речи не получится. Smile
очень полезно для самокритики, да! а можете туда еще всякого побольше, а? частотность шипящих, например... еще хорошо бы проверку на неблагозвучность на стыке слов, цепочки родительных падежей, расщепленные сказуемые (но это я совсем себе технически не представляю) или прилагательные подряд? или я совсем размечталась?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
vmb


Зарегистрирован: 14.02.2010
Сообщения: 390

 

СообщениеДобавлено: Вт Мар 16, 2010 8:54 am    Заголовок сообщения: Ответить с цитатой

fluffy
Ну, как раз «и», мне кажется, там к месту, в таком количестве. В оригинале сплошной полисиндетон (можете прогнать английский текст через статистику), эдакий бытовой эпос получается, вроде «Слова о полку Игореве» :)

Я, может, буду по чуть-чуть добавлять, ещё не знаю. На всякий случай, можно писать всякие идеи, не исключено, что какие-то пойдут в дело)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
nadine


Зарегистрирован: 11.05.2009
Сообщения: 78

 

СообщениеДобавлено: Вт Мар 16, 2010 5:03 pm    Заголовок сообщения: Ответить с цитатой

vmb, спасибо, какая штука хорошая ))
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Школа перевода В. Баканова -> Полезные и интересные ссылки Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете добавлять приложения в этом форуме
Вы можете скачивать файлы в этом форуме


Сайт создан в марте 2006. Перепечатка материалов только с разрешения владельца ©