greenadine: (Default)
[personal profile] greenadine
Опишу несколько раз, что именно мне надо, сложность именно в том, что я сам не знаю, как называется то, что мне нужно.
1. Изначальная проблема: я учил армянский по французскому самоучителю. В нём использовалось всего два армянских шрифта, рано или поздно я с ними ознакомился и «читал» бегло. Приехав в Армению, я обнаружил, что не узнаю половину букв во встречаемых надписях. Т.е. я заучил буквы не [вставить правильный термин], а едва ли не попиксельно. И мне не было понятно, на что смотреть: где у буквы «значимый» кусочек, а где – украшения, свойства шрифта.
2. Мне нужно описание алфавита (вообще – некоторого набора графических символов), описывающих каждый символ так, что, увидев реальное изображение, я смогу понять, какой именно из символов изображён.
3. Не нужны совершенные системы. Понятно, что для любого описания разницы между «Л» и «Г» можно составить два легко читаемых человеком шрифта, в которых одна и та же картинка будет восприниматься, как два разных символа. Не нужно универсальности и авангарда, интересны основные, «нормальные» случаи.
4. Также неинтересны отличия почерков – это другая задача. Для простоты предположим, что текст напечатан «нормальным» шрифтом.
5. Не путать с разбором неизвестной письменности, когда найден документ с 1000 знаков, и их нужно разбить на группы одинаковых. Вопросы «это один символ или их было два» интересны, но мне пока нужно не это. Подразумевается, что полный набор символов чётко определён.
6. [livejournal.com profile] mbla описывала как-то справочник по цветам и травам. Находишь травку, отвечаешь на цепь вопросов, в конце – ответ, что именно это за растение. Это могло бы быть формой того, что я ищу. И точно так же как справочник по растениям работает только в определённой местности, мой справочник работал бы только для определённого алфавита.
7. Скорее всего, это есть у людей, занимающихся OCR (распознавание текста). Возможно, у дизайнеров, разрабатывающих шрифты.
8. Мне нужна любая информация, любые соображения на эту тему. Ключевые слова. Например, в фонетике смыслоразличительная единица называется фонемой. А в графике?
9. Пример: в линейном письме B есть всего две буквы, общим контуром которых является круг. «Каноническое» написание первой (ka) – с крестом посредине, второй (qe) – с четырьмя точками, как пуговица. При этом для первой не важно, как именно повёрнут крест (прямой или «андреевский»), ни насколько прямы линии (могут быть слегка «под свастику»). А для второй – количество точек (их может быть две, три, а то и вовсе две параллельные палочки, как знак «=»).
10. Ещё пример: Ի и Ւ - это две разные буквы. Смыслоразличителем является палочка направо.

Date: 2005-05-12 04:41 pm (UTC)
From: [identity profile] krl-pgh.livejournal.com
Не будучи специалистом: мне кажется, что обычно имеет место топологическое подобие между "одинаковыми" символами.

Date: 2005-05-12 04:58 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Несомненно. И вот, передо мной лежит справа таблица всех символов (шрифтом А), слева - один (шрифтом Б), который нужно опознать (найти) в табличке справа. Задача это не всегда тивиальная, если не знать, как устроен каждый символ, что у него "важно".

Date: 2005-05-12 07:50 pm (UTC)
From: [identity profile] cema.livejournal.com
Это не так, к сожалению.

Date: 2005-05-12 04:54 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Мне кажется, такой справочник сводится к образцам текста, набранных несколькими "нормальными" (в твоем определении) шрифтами. Это просто и достаточно для поставленной задачи, нет?

Date: 2005-05-12 04:59 pm (UTC)
From: [identity profile] greenadine.livejournal.com
В принципе, да, т.е. составление таких правил оставляется на тихую работу мозга в background. Меня интересует именно осознание этого процесса.
Понятно, что мне не нужны такие таблички для кириллицы или латинского алфавита, вопрос в том, как я это делаю?

Date: 2005-05-12 05:10 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Я думаю, это бесконечно сложно, как распознавание зрительных образов (не OCR, a настоящее: если положить три веточки определенным образом, люди, знакомые с соостветствующим алфавитом, немедленно согласятся, что это буква А и т.д.) И небесконечно гибко -- читать готический шрифт, скажем, невозможно без подготовки. Или объявить его на этом основании вторым латинским алфавитом?

Date: 2005-05-12 05:14 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Плюс, конечно, в практической ситуации ты знаешь язык, на котором читаешь, и узнаешь знакомые слова целиком без помощи индивидуальных букв и их различий...

Date: 2005-05-12 05:30 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Это совсем другая задача. У меня всего лишь нахождение одной буквы в списке возможных.

Date: 2005-05-12 05:30 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Готический алфавит - это, конечно же, не латинский :)
Впрочем, есть готический стиль (шрифт) у латинского, его я бы отнёс к "извращённым". Меня интересуют как раз простые, стандартные печатные буквы.

Date: 2005-05-12 07:51 pm (UTC)
From: [identity profile] cema.livejournal.com
Он другой. Так же как "старый" ивритский шрифт и "новый" (квадратный, арамейский).

Date: 2005-05-14 12:55 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Картина усугубляется. Я сегодня дочитал, что есть готический алфавит, которым записывали готский язык, и готический алфавит - разновидность латинского, на том же уровне, как минискул, италик и т.п. Бардак в названиях :)

Date: 2005-05-12 07:49 pm (UTC)
From: [identity profile] cema.livejournal.com


В фирме "ПараГраф", в отделе распознавания рукописных текстов, эта единица называлась "хренятина". По-английски XR element. :-) Но это было внутреннее название.

Date: 2005-05-14 01:01 pm (UTC)
From: [identity profile] greenadine.livejournal.com
И был справочник букв и определяющих их хренятин? Существенные и несущественные хренятины?
Английский термин, похоже, даёт что-то. Копаю, спасибо.

Date: 2005-05-12 10:06 pm (UTC)
From: [identity profile] annyway.livejournal.com
Вы будете смеяться, но аналог фонемы в письменной речи называется графемой.

Date: 2005-05-14 01:00 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Мне нужен более мелкий уровень. Т.е., насколько я понял из найденого яндексом определения, графема - это, грубо говоря, буква. Т.е. минимальная единица письма. А меня интересует графическая единица состава буквы. Т.е. заглавное "А" - это треугольник, две линии которого продлены наружу от точек, отличных от точки пересечения этих линий, которая рисуется сверху. И так далее.

Date: 2005-05-14 02:47 pm (UTC)
From: [identity profile] annyway.livejournal.com
Набор графических элементов, сочетающихся определенным образом - это, по-моему, и есть буква.

Date: 2005-05-14 02:49 pm (UTC)
From: [identity profile] annyway.livejournal.com
Тут ведь еще какая путаница - говоря "буква" мы, как правило, имеем в виду именно графему. Точно так же, как говоря "звук" имеем в виду фонему.

Date: 2005-05-14 02:17 pm (UTC)
From: [identity profile] greenadine.livejournal.com
А может и то, что нужно... Есть какие-то списки, определения, отличительные черты графем? Как их отличают, одну от другой?

Date: 2005-05-14 02:44 pm (UTC)
From: [identity profile] annyway.livejournal.com
Я не лингвист, к сожалению. Если я правильно понимаю, то графема - это буква во всей совокупности ее начертаний. То есть, допустим, "а" печатная и "а" рукописная (даже искаженная индивидуальным почерком до полной неузнаваемости) - это одна и та же графема. Но я, например, совершенно не знаю, являются ли одной графемой а и А. Кажется, должны, по идее.
Не знаю, как отличают. В моем, например, почерке графему "п" от графемы "н" можно отличить только интуитивно, по контексту. :-)

Date: 2005-05-23 09:24 pm (UTC)
From: [identity profile] obscuredbycloud.livejournal.com
Либо я вас не понимаю, либо вы хотите что-то выучить, при этом говорите "я сейчас тебя научу как меня учить" (у меня тоже такое есть:-)).
Теоритически то, что вы хотите имеет право на существование, но подобный справочник практически не имеет смысла.
В случае вашего примера (10.) они могут быть и вовсе одинаковыми, но различаться в слове будут не по черточке, а как бы по контексту, т.е. по слову. Как и в случае английских I и l. (Я например не могу сказать, какая из них И, а какая Вьюн - просто не помню, хотя по армянски читаю).
Ещё один аргумент против такого справочника: если бы такой справочник существовал, то он являлся бы чем-то вроде законодательного акта, а иначе если его не будут придерживаться, то опять же, теряется его смысл. Т.е., вы вот писали, что буква "А" это треугольник с палкой по середине, но ведь "А" может быть не треугольником, а прямоугольником (есть такие шрифты), а ещё она может не иметь черточку (но это, наверное, можно отнести к извращениям).

Кстати, вот ещё интересная тема (http://www.livejournal.com/users/obscuredbycloud/14692.html).
Ответьте на вопрос.
Мой ответ - 4.

Date: 2005-05-24 12:54 pm (UTC)
From: [identity profile] greenadine.livejournal.com
Мой ответ не предусмотрен: картинка не открывается - домен <.ru> забанен на работе :-)

Что я хочу - выучить алфавит (научиться читать) отдельно от знания языка. Тот же армянский: я его не знаю совершенно. Но со словарем хочу уметь разбирать несложные надписи. Для этого я должен узнавать буквы, в пределах каких-то "приличных" шрифтов (не будем про готические стилизации).

Ваш пример с буквой "А" легко описывается следующим образом: это буква, топологически представляющая собой кольцо с двумя отходящими от него лучиками, направленными вниз.
Никаких других букв, подходящих под это определение в русском языке вроде как нет. Хотя нет, есть еще "Д", но принцип понятен :-)

Или в другой форме: вопросник для заглавных букв. Сколько колец в вашей букве? 0 (Г Е Ё Ж З И Й К Л М Н С Т У Х Ц Ч Ш Щ Э), 1 (А Б Д О П Р ъ Ы ь Ю Я) или 2 (В Ф). Затем по каждому из классов свои вопросы, например для последней группы: кольца находятся по вертикали друг от друга или по горизонтали?
Да, можно придумать шрифт, в котором вопросник будет обманываться, но для подавляющего большинства случаев он прокатит.

Date: 2005-05-25 02:29 am (UTC)
From: [identity profile] obscuredbycloud.livejournal.com
Ну в общем я вас понял.
Никогда не слышал про что либо подобное...

> Мой ответ не предусмотрен: картинка не открывается - домен <.ru> забанен на работе :-)

Наконец выдался повод зарегистрироваться на ljplus. Набрал http://www.ljplus.com - не отвечает, попробовал ljplus.ru - о!, оно. Зарегистрировался, выложил картинку, написал пост, пару раз нажал Preview, и только потом "обнаружил", что ljplus.ru.
Ладно, хрен с ним с этим вопросом:)

Date: 2005-05-25 02:31 am (UTC)
From: [identity profile] obscuredbycloud.livejournal.com
Пардно, в предыдущем сообщении техническая ошибка:

Зарегистрировался, выложил картинку, написал пост, пару раз нажал Preview, и только потом "обнаружил", что ljplus.ru.
Ладно, хрен с ним с этим вопросом:)

Date: 2005-05-25 02:32 am (UTC)
From: [identity profile] obscuredbycloud.livejournal.com
Ага, и в этом ошибка. Так, ладно, спать пора, сорри что засорил журнал:)

Date: 2005-06-11 07:26 am (UTC)
From: [identity profile] prokofyev.livejournal.com
Саня, я не могу тебе помочь с таким (в)опросником, но на всякий случай даю ссылочку на определитель шрифтов по описанию - http://www.identifont.com/identify.html
Может, пригодится когда-нибудь. Мне нравилось с его помощью разбирать, на какие элементы написания нужно обращать внимание при изучении шрифта.

Date: 2005-06-13 03:02 pm (UTC)
From: [identity profile] greenadine.livejournal.com
О! Саня, это пока самое точное понимание моего вопроса :-) Спасибо!

Profile

greenadine: (Default)
greenadine

December 2025

S M T W T F S
 123456
78910111213
141516 17181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 11th, 2026 08:08 am
Powered by Dreamwidth Studios