dmitriyandreev: (Default)
dmitriyandreev ([personal profile] dmitriyandreev) wrote2024-10-27 04:40 pm

Смена концепций

Поделюсь ссылкой: https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp
Краткое изложение: лингвисты трудились-трудились, а в итоге перемножение матриц на достаточно больших мощностях сделало их труд малонужным.

История про ABBYY - она шире чем "выкачали ресурсы в виде мозгов, устроились на западе и окэшились". И сложнее чем "чатгпт круто, все эти Хомские нафиг никому не нужны".
 
(отмечу, что старик Хомский, конечно, глубоко неправ в своей поддержке противников СССР и СРВ в лице "красных кхмеров").
 
А в данном случае мы видим интересную вещь, которая уже была. Была старая концепция, в которую были вложены колоссальные ресурсы (в первую очередь интеллектуальные). Все, что касалось этой концепции, в головах образованного класса было с ней связано и она применялась (по возможности, естественно). Не идиотами, не в рамках манипуляций, "все честно было".
 
Но вот происходит "революция в познании" и старое выкидывается вон. Все, практика отвергла.
 
Мне это очень напоминает астрологию, если честно. XV-XVI века - расцвет астрологии, используется всеми (кто что-нибудь значат) и везде. А потом вот как-то все - и остается у любителей и на задних страницах бесплатных газет. 
lxe: (hardware acceleration)

все еще шире

[personal profile] lxe 2024-10-27 03:39 pm (UTC)(link)
Астрология и сейчас в бою, только она называется "технический анализ".
Собственно, в истории с ABBYY победил именно астрологический подход: фундаментального анализа не надо, давайте следовать за эпифеноменом.
Но сделать то же самое на бирже, побить техническим анализом фундаментальный (не в смысле метрики типа долг к капиталу, это тоже эпифеномены, а знание, что Педро не пойдет на Семнадцатую, ему там нечего делать) никому не удалось и едва ли удастся. Реальность даст о себе знать. Об этом Талеб и unknown unknowns.

Урок из истории с ABBYY в том, что сигнальная система "речь" (в отличие от сигнальной системы "рынок") существует отдельно от описываемой ей реальности. Собственно, и "описываемой" сказать нельзя: речевое поведение -- это адаптация, как и другие виды поведения. Оно иногда направлено на понимание вещей и само является мощнейшим инструментом понимания. В этом смысле не только лингвистика, но и, страшно сказать, философская антропология остаются и нужными, и практически полезными. Но для 99.(9)% людей речь является средством достижения некогнитивных целей, и притом для квалифицированного большинства (в зависимости от доли сферы услуг в ВВП — от 60% до 80%) — неосновным средством, которому научаются так же, как до нее научались охоте и собирательству: лапами-лапами. Педанты и пуристы (и по ровно той же причине — fact checkers) раздражают именно потому, что рамки, границы и законы, которые они устанавливают, требуя бОльшей дисциплины, чем лапами-лапами, не дают того эволюционного/предпринимательского преимущества, которое Фрэнсис Бэкон назвал "knowledge itself is power".

Ну, и еще одна иллюстрация к тому, что умопостигаемого философами объективного блага нет. (Казалось бы, при чем тут политические новости десятилетия.)
lxe: (Default)

Re: все еще шире

[personal profile] lxe 2024-10-28 06:31 pm (UTC)(link)
Искусственные машинно-читаемые языки (например, алгоритмические) учат иначе. Пробы и ошибки при этом тоже важны, но "узуса", которому для успеха дела достаточно было бы подражать, нет. Есть описание языка, есть диагностические ответы компилятора, есть такое соображение, как легкость редактирования.

Мне трудно дать пример человеческой речи, которая бы оценивалась по легкости ее редактирования.

Инженер-программист, для которого аргументом защиты на code review является "так говорят" "так пишут", направляется вон из профессии следом за водителем, который оправдывался бы фразой "так ездят".
lxe: (Default)

Re: все еще шире

[personal profile] lxe 2024-10-29 05:20 pm (UTC)(link)
Ценю доверие, но все-таки готов и обосновать.
Средства автоматического анализа кода существуют и применяются именно потому, что узуса как "планки качества" недостаточно.
Речь — не единственная знаковая система, где действует легитимация от узуса (еще есть, например, эзотерика), но наиболее частоупотребительная.
Edited (и применяются) 2024-10-29 17:21 (UTC)
lxe: (Default)

Re: все еще шире

[personal profile] lxe 2024-10-28 06:34 pm (UTC)(link)
И да, сначала пропустил: усвоение родного языка (в отличие от научения иностранному или освоения литературного или специального стиля) не требует боли.
Оно и практики-то говорения требует не особенно много. Говорить начинают, наслушавшись.
Совершенно другую форму принимает обратная связь.
juan_gandhi: (Default)

[personal profile] juan_gandhi 2024-10-28 07:26 am (UTC)(link)
Но лингвистика же, наука. Была. Почти 20 лет назад я спорил с Гензелем, автором гугл-транслейт, что система должна знать грамматику; а он посылал всю грамматику и опирался на корпус и статистику. Ну он прав был, конечно.