Патент на изобретение №2311680
|
||||||||||||||||||||||||||
(54) СПОСОБ АВТОМАТИЗИРОВАННОГО РАЗБИЕНИЯ НА ГРУППЫ УРОВНЕЙ ЯРКОСТИ ПИКСЕЛОВ РАСТРОВЫХ ИЗОБРАЖЕНИЙ ПО ЗНАЧЕНИЯМ ИХ ПОВТОРЯЕМОСТИ
(57) Реферат:
Изобретение относится к распознаванию растровых изображений и предназначено для увеличения эффективности определения пороговых значений яркости пикселов либо характеристик, производных от них для заданных матриц растровых изображений. Технический результат – увеличение эффективности определения пороговых значений яркости пикселов достигается тем, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой. Данный критерий позволяет эффективно выделять как оптимальное число N групп в гистограмме, так и состав групп в тех случаях, когда характер гистограммы позволяет сделать это. 3 ил.u2. Показатель кучности задан формулой В качестве лучшего принимается разбиение с наименьшим значением показателя . При отсутствии ограничений для любой гистограммы Н глобальный минимум показателя =0 будет достигаться на тривиальном разбиении на кучи, при котором каждая куча состоит только из одного числа si. Однако такой глобальный минимум не дает конструктивной информации по разделению изображения. Поэтому предложено на область поиска наложить дополнительные ограничения: 1) вначале группы su н идет возрастание значений повторяемости, а в конце su к – их убывание, 2) объем каждой кучи не должен быть слишком малым (Qu/Q1/8), 3) число куч не должно быть больше 4 (N4). Предложенный способ обладает следующими недостатками. 1. При возрастании N величина критерия как правило также возрастает. Это не позволяет сравнивать пороговые разбиения с различными значениями N. Данный критерий позволяет сравнивать между собой разбиения с одинаковыми количествами групп N. 2. В то же время для модельной гистограммы вида, показанного на Фиг.1, критерий без введения порога (N=1) и с введением одного порога (N=2), дающего искомое разделение, равен нулю. Т.е. рассмотренный критерий не всегда позволяет сравнивать разбиения с одинаковым числом порогов. Задачей изобретения является создание способа автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, который не будет иметь перечисленных выше недостатков. Поставленная задача достигается тем, что предложен способ автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, заключающийся в том, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем вначале группы идет возрастание значений повторяемости, а в конце – их убывание, соотношение объема каждой группы к общему объему должно быть не менее 1/8 и число групп не должно быть больше 4, для каждой группы введен показатель качества, а для всего разбиения – обобщенный показатель качества, критерием оптимальности которого является минимум, согласно изобретению в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой, а обобщенный показатель качества всего разбиения на группы имеет вид: где N – число групп, – объем группы с номером u (u=1, …, N), {h1, …, hn} – повторяемости, соответствующие уровням яркости пикселов {s1, …, sn}, – показатель качества группы с номером u, su н, su к – начальное и конечное значения яркости в группе с номером u, su м – медиана значений яркости в группе с номером u. Рассмотрим для n уровней яркости пикселов si(i=1,…,n) гистограмму их повторяемости Н={h1,…,hn}. Как показали эксперименты, для фиксированной группы su частным критерием качества, наилучшим образом отражающим свойство “кучности”, является не дисперсия, а момент инерции группы относительно ее медианы su м: Для того чтобы объединить выбранные частные критерии в один общий, рассмотрим в качестве модельного равномерное распределение характеристики интенсивности h с большим числом значений, равномерно распределенным в интервале [0,1] (Фиг.2). В данной гистограмме критерий не должен выделять пороги, поскольку на самом деле их не существует. При отсутствии деления гистограммы на группы общий момент инерции относительно медианы равен где Q=h·1 – общий объем гистограммы. При произвольном разбиении данной гистограммы на N групп, которые по оси s занимают отрезки длиной s1, s2,…,sN(s1+s2+…+sN=1), их моменты инерции будут равны Значение общего суммарного критерия останется неизменным (до и после разбиения) в том случае, когда каждый частный критерий f(gu) будет включен в общую сумму с весовым коэффициентом 1/(su 2). Вводя в рассматриваемых задачах в коэффициенты вместо su величины объемов групп qu, получим обобщенный критерий следующего вида: Данный критерий позволяет эффективно выделять как оптимальное число N групп в гистограмме, так и состав групп в тех случаях, когда характер гистограммы позволяет сделать это. Для практической реализации предложенного способа может быть использован следующий алгоритм. ИСХОДНЫЕ ДАННЫЕ. Для некоторой числовой характеристики s задана гистограмма H, а также пороговое значение предельно малого относительного объема групп. Необходимо выяснить возможность порогового разделения гистограммы для заданной гистограммы. Если возможно, то найти такое число N групп в гистограмме и их состав, при котором достигает минимума обобщенный критерий при условии, что относительный объем групп не превышает и разделение групп производится в области локальных минимумов на гистограмме. ПРЕДВАРИТЕЛЬНЫЕ ДЕЙСТВИЯ. Вычисляется общий объем гистограммы Q и пороговое предельно малое значение объема группы Qпр=·Q. Поскольку разделение должно происходить в области локальных минимумов на гистограмме, то работа алгоритма начинается с их поиска. ШАГ 1. Предварительный просмотр гистограммы. Выделение всех локальных минимумов на ней. Данные минимумы бывают одиночные (когда в точке минимума s=si выполняется условие hS(i-1)>hS i ШАГ 2. Расчет начального значения критерия при отсутствии порогов: Fнач=F(N=1). Это же значение присваиваем текущему минимальному значению критерия: Fmin=Fнач. ШАГ 3. Перебор всех возможных вариантов порогов, вычисление значений критерия для них и выбор оптимального варианта. 3.1. Генерация возможных порогов. Поскольку для каждого возможного порога Рi есть две возможности – входить в набор или нет, то общее число нерассмотренных вариантов порогов равно (один вариант, в котором в набор не вошел ни один порог, рассмотрен на ШАГЕ 2). Кодируя каждый из вариантов числом от 1 до , вхождение каждого из порогов в выбранном варианте i находим, разлагая это число в двоичной системе в вектор длины nm. Те позиции j, на которых стоит 1, задают вхождение j-го порога в набор. Если стоит 0, то порог не входит в набор. 3.2. Проверка набора порогов по предельно малому объему группы Qпр. Каждый конкретный набор порогов задает на гистограмме некоторый набор групп. Объемы всех групп Qu проверяются на выполнение условия Qu>Qпр. Если хотя бы для одной из групп условие не выполнено, весь набор исключается из дальнейшего анализа. 3.3. Вычисление критерия. Проверка оптимальности пороговых порогов. Для выбранного набора групп s1, s2,…,sN вычисляется значение критерия F(s1, s2,…,sN). Если выполняется условие F(s1, s2,…,sN) ШАГ 4. Итоговая проверка. Если после окончания перебора всех вариантов порогов выяснилось, что Fmin=Fнач, то это свидетельствует, что гистограмма плохо разделима на группы и введение порогов на ней нецелесообразно. Выход из алгоритма с отрицательным ответом. Если Fmin Пример. ИСХОДНЫЕ ДАННЫЕ. Для двухцветного растрового 16-цветного изображения (n=16) размером 20×80 получена гистограмма, показанная на Фиг.3, у которой h0=14; h1=9; h2=9; h3=14; h4=13; h5=8; h6=11; h7=9; h8=12; h9=7; h10=7; h11=7; h12=10; h13=8; h14=10; h15=12. Пороговое значение предельно малого относительного объема групп =0,15. Необходимо выяснить возможность порогового разделения гистограммы для заданной гистограммы. Если возможно, то найти такое число N групп в гистограмме и их состав, при котором достигает минимума обобщенный критерий при условии, что относительный объем групп не превышает и разделение групп производится в области локальных минимумов на гистограмме. ПРЕДВАРИТЕЛЬНЫЕ ДЕЙСТВИЯ. Вычисляется: 1) общий объем гистограммы: Q=160, 2) пороговое предельно малое значение объема группы Qпр=·Q=0,15·160=24. ШАГ 1. Выделены внутренние локальные минимумы гистограммы, которые задают начало возможных групп: 1, 6, 9, 13. Общее число их равно 4. ШАГ 2. Начальное значение критерия при отсутствии порогов: Fнач=F(N=1)=0,141392. Это же значение присваиваем текущему минимальному значению критерия: Fmin=Fнач. ШАГ 3. Перебор всех возможных вариантов порогов, вычисление значений критерия для них и выбор оптимального варианта. Вариант 1000, значение критерия: F=0,146384>Fmin. Вариант 0100, значение критерия: F=0,144421>Fmin. Вариант 1100, значение критерия: F=0,14888>Fmin. Вариант 0010, значение критерия: F=0,131995 Вариант 1010, значение критерия: F=0,134505>Fmin. Вариант 0110, значение критерия: F=0,128107 Вариант 0001, значение критерия: F=0,133057>Fmin. Вариант 1001, значение критерия: F=0,132206>Fmin. Вариант 0101, значение критерия: F=0,140083>Fmin. Вариант 1101, значение критерия: F=0,144533>Fmin. У вариантов 0011, 1011, 0111, 1111 есть группы с объемом, меньшим Qпр, поэтому они не анализируются. В итоге оптимальным принят вариант 0110 со значением критерия F=0,128107. Пороговые значения 5,5 и 11,5. При этом N=3, s1={0,1,2,3,4,5}, s2={6,7,8,9,10,11}, s3={12,13,14,15}.
Формула изобретения
Способ автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, заключающийся в том, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем вначале группы идет возрастание значений повторяемости, а в конце – их убывание, соотношение объема каждой группы к общему объему должно быть не менее 1/8 и число групп не должно быть больше 4, для каждой группы введен показатель качества, а для всего разбиения – обобщенный показатель качества, критерием оптимальности которого является минимум, отличающийся тем, что в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой, а обобщенный показатель качества всего разбиения на группы имеет вид: где N – число групп уровней яркости пикселов, s1, s2,…,sN, – группы уровней яркости пикселов, – объем группы с номером u (u=1,…,N), {h1,…,hn} – повторяемости, соответствующие уровням яркости пикселов {s1,…,sn}, – показатель качества группы с номером u, su н, su к – начальное и конечное значения яркости в группе с номером u, su м – медиана значений яркости в группе с номером u.
РИСУНКИ
|
||||||||||||||||||||||||||