Ищу описания письменностей
May. 12th, 2005 06:25 pmОпишу несколько раз, что именно мне надо, сложность именно в том, что я сам не знаю, как называется то, что мне нужно.
1. Изначальная проблема: я учил армянский по французскому самоучителю. В нём использовалось всего два армянских шрифта, рано или поздно я с ними ознакомился и «читал» бегло. Приехав в Армению, я обнаружил, что не узнаю половину букв во встречаемых надписях. Т.е. я заучил буквы не [вставить правильный термин], а едва ли не попиксельно. И мне не было понятно, на что смотреть: где у буквы «значимый» кусочек, а где – украшения, свойства шрифта.
2. Мне нужно описание алфавита (вообще – некоторого набора графических символов), описывающих каждый символ так, что, увидев реальное изображение, я смогу понять, какой именно из символов изображён.
3. Не нужны совершенные системы. Понятно, что для любого описания разницы между «Л» и «Г» можно составить два легко читаемых человеком шрифта, в которых одна и та же картинка будет восприниматься, как два разных символа. Не нужно универсальности и авангарда, интересны основные, «нормальные» случаи.
4. Также неинтересны отличия почерков – это другая задача. Для простоты предположим, что текст напечатан «нормальным» шрифтом.
5. Не путать с разбором неизвестной письменности, когда найден документ с 1000 знаков, и их нужно разбить на группы одинаковых. Вопросы «это один символ или их было два» интересны, но мне пока нужно не это. Подразумевается, что полный набор символов чётко определён.
6.
mbla описывала как-то справочник по цветам и травам. Находишь травку, отвечаешь на цепь вопросов, в конце – ответ, что именно это за растение. Это могло бы быть формой того, что я ищу. И точно так же как справочник по растениям работает только в определённой местности, мой справочник работал бы только для определённого алфавита.
7. Скорее всего, это есть у людей, занимающихся OCR (распознавание текста). Возможно, у дизайнеров, разрабатывающих шрифты.
8. Мне нужна любая информация, любые соображения на эту тему. Ключевые слова. Например, в фонетике смыслоразличительная единица называется фонемой. А в графике?
9. Пример: в линейном письме B есть всего две буквы, общим контуром которых является круг. «Каноническое» написание первой (ka) – с крестом посредине, второй (qe) – с четырьмя точками, как пуговица. При этом для первой не важно, как именно повёрнут крест (прямой или «андреевский»), ни насколько прямы линии (могут быть слегка «под свастику»). А для второй – количество точек (их может быть две, три, а то и вовсе две параллельные палочки, как знак «=»).
10. Ещё пример: Ի и Ւ - это две разные буквы. Смыслоразличителем является палочка направо.
1. Изначальная проблема: я учил армянский по французскому самоучителю. В нём использовалось всего два армянских шрифта, рано или поздно я с ними ознакомился и «читал» бегло. Приехав в Армению, я обнаружил, что не узнаю половину букв во встречаемых надписях. Т.е. я заучил буквы не [вставить правильный термин], а едва ли не попиксельно. И мне не было понятно, на что смотреть: где у буквы «значимый» кусочек, а где – украшения, свойства шрифта.
2. Мне нужно описание алфавита (вообще – некоторого набора графических символов), описывающих каждый символ так, что, увидев реальное изображение, я смогу понять, какой именно из символов изображён.
3. Не нужны совершенные системы. Понятно, что для любого описания разницы между «Л» и «Г» можно составить два легко читаемых человеком шрифта, в которых одна и та же картинка будет восприниматься, как два разных символа. Не нужно универсальности и авангарда, интересны основные, «нормальные» случаи.
4. Также неинтересны отличия почерков – это другая задача. Для простоты предположим, что текст напечатан «нормальным» шрифтом.
5. Не путать с разбором неизвестной письменности, когда найден документ с 1000 знаков, и их нужно разбить на группы одинаковых. Вопросы «это один символ или их было два» интересны, но мне пока нужно не это. Подразумевается, что полный набор символов чётко определён.
6.
7. Скорее всего, это есть у людей, занимающихся OCR (распознавание текста). Возможно, у дизайнеров, разрабатывающих шрифты.
8. Мне нужна любая информация, любые соображения на эту тему. Ключевые слова. Например, в фонетике смыслоразличительная единица называется фонемой. А в графике?
9. Пример: в линейном письме B есть всего две буквы, общим контуром которых является круг. «Каноническое» написание первой (ka) – с крестом посредине, второй (qe) – с четырьмя точками, как пуговица. При этом для первой не важно, как именно повёрнут крест (прямой или «андреевский»), ни насколько прямы линии (могут быть слегка «под свастику»). А для второй – количество точек (их может быть две, три, а то и вовсе две параллельные палочки, как знак «=»).
10. Ещё пример: Ի и Ւ - это две разные буквы. Смыслоразличителем является палочка направо.
no subject
Date: 2005-05-12 04:41 pm (UTC)no subject
Date: 2005-05-12 04:58 pm (UTC)no subject
Date: 2005-05-12 07:50 pm (UTC)no subject
Date: 2005-05-12 04:54 pm (UTC)no subject
Date: 2005-05-12 04:59 pm (UTC)Понятно, что мне не нужны такие таблички для кириллицы или латинского алфавита, вопрос в том, как я это делаю?
no subject
Date: 2005-05-12 05:10 pm (UTC)no subject
Date: 2005-05-12 05:14 pm (UTC)no subject
Date: 2005-05-12 05:30 pm (UTC)no subject
Date: 2005-05-12 05:30 pm (UTC)Впрочем, есть готический стиль (шрифт) у латинского, его я бы отнёс к "извращённым". Меня интересуют как раз простые, стандартные печатные буквы.
no subject
Date: 2005-05-12 07:51 pm (UTC)no subject
Date: 2005-05-14 12:55 pm (UTC)no subject
Date: 2005-05-12 07:49 pm (UTC)В фирме "ПараГраф", в отделе распознавания рукописных текстов, эта единица называлась "хренятина". По-английски XR element. :-) Но это было внутреннее название.
no subject
Date: 2005-05-14 01:01 pm (UTC)Английский термин, похоже, даёт что-то. Копаю, спасибо.
no subject
Date: 2005-05-12 10:06 pm (UTC)no subject
Date: 2005-05-14 01:00 pm (UTC)no subject
Date: 2005-05-14 02:47 pm (UTC)no subject
Date: 2005-05-14 02:49 pm (UTC)no subject
Date: 2005-05-14 02:17 pm (UTC)no subject
Date: 2005-05-14 02:44 pm (UTC)Не знаю, как отличают. В моем, например, почерке графему "п" от графемы "н" можно отличить только интуитивно, по контексту. :-)
no subject
Date: 2005-05-23 09:24 pm (UTC)Теоритически то, что вы хотите имеет право на существование, но подобный справочник практически не имеет смысла.
В случае вашего примера (10.) они могут быть и вовсе одинаковыми, но различаться в слове будут не по черточке, а как бы по контексту, т.е. по слову. Как и в случае английских I и l. (Я например не могу сказать, какая из них И, а какая Вьюн - просто не помню, хотя по армянски читаю).
Ещё один аргумент против такого справочника: если бы такой справочник существовал, то он являлся бы чем-то вроде законодательного акта, а иначе если его не будут придерживаться, то опять же, теряется его смысл. Т.е., вы вот писали, что буква "А" это треугольник с палкой по середине, но ведь "А" может быть не треугольником, а прямоугольником (есть такие шрифты), а ещё она может не иметь черточку (но это, наверное, можно отнести к извращениям).
Кстати, вот ещё интересная тема (http://www.livejournal.com/users/obscuredbycloud/14692.html).
Ответьте на вопрос.
Мой ответ - 4.
no subject
Date: 2005-05-24 12:54 pm (UTC)Что я хочу - выучить алфавит (научиться читать) отдельно от знания языка. Тот же армянский: я его не знаю совершенно. Но со словарем хочу уметь разбирать несложные надписи. Для этого я должен узнавать буквы, в пределах каких-то "приличных" шрифтов (не будем про готические стилизации).
Ваш пример с буквой "А" легко описывается следующим образом: это буква, топологически представляющая собой кольцо с двумя отходящими от него лучиками, направленными вниз.
Никаких других букв, подходящих под это определение в русском языке вроде как нет. Хотя нет, есть еще "Д", но принцип понятен :-)
Или в другой форме: вопросник для заглавных букв. Сколько колец в вашей букве? 0 (Г Е Ё Ж З И Й К Л М Н С Т У Х Ц Ч Ш Щ Э), 1 (А Б Д О П Р ъ Ы ь Ю Я) или 2 (В Ф). Затем по каждому из классов свои вопросы, например для последней группы: кольца находятся по вертикали друг от друга или по горизонтали?
Да, можно придумать шрифт, в котором вопросник будет обманываться, но для подавляющего большинства случаев он прокатит.
no subject
Date: 2005-05-25 02:29 am (UTC)Никогда не слышал про что либо подобное...
> Мой ответ не предусмотрен: картинка не открывается - домен <.ru> забанен на работе :-)
Наконец выдался повод зарегистрироваться на ljplus. Набрал http://www.ljplus.com - не отвечает, попробовал ljplus.ru - о!, оно. Зарегистрировался, выложил картинку, написал пост, пару раз нажал Preview, и только потом "обнаружил", что ljplus.ru.
Ладно, хрен с ним с этим вопросом:)
no subject
Date: 2005-05-25 02:31 am (UTC)Зарегистрировался, выложил картинку, написал пост, пару раз нажал Preview, и только потом "обнаружил", что ljplus.ru.
Ладно, хрен с ним с этим вопросом:)
no subject
Date: 2005-05-25 02:32 am (UTC)no subject
Date: 2005-06-11 07:26 am (UTC)Может, пригодится когда-нибудь. Мне нравилось с его помощью разбирать, на какие элементы написания нужно обращать внимание при изучении шрифта.
no subject
Date: 2005-06-13 03:02 pm (UTC)