RU2431918C1 - Method of compressing information - Google Patents
Method of compressing information Download PDFInfo
- Publication number
- RU2431918C1 RU2431918C1 RU2010111201/09A RU2010111201A RU2431918C1 RU 2431918 C1 RU2431918 C1 RU 2431918C1 RU 2010111201/09 A RU2010111201/09 A RU 2010111201/09A RU 2010111201 A RU2010111201 A RU 2010111201A RU 2431918 C1 RU2431918 C1 RU 2431918C1
- Authority
- RU
- Russia
- Prior art keywords
- code
- column
- row
- codes
- symbols
- Prior art date
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Предлагаемое изобретение относится к области информационных технологий, информационной техники, телемеханики и др.The present invention relates to the field of information technology, information technology, telemechanics, etc.
Известны следующие способы сжатия информации: дельта-кодирование [1], алгоритм Лемпеля-Зива-Велча [2], кодирование методом Хаффмана [1], арифметическое кодирование [3] и др. При дельта-кодировании используются разницы между последовательными данными вместо самих данных. Это помогает в случае дальнейшей компрессии этих данных, в которых часто встречаются повторяющиеся значения, и не очень полезно в случае, когда используется само по себе. Алгоритм Лемпеля-Зива-Велча при сжатии динамически создает таблицу преобразования строк. Для каждого конкретного случая она индивидуальна. При кодировании методом Хаффмана и арифметическом кодировании необходимо проводить анализ текста с целью определения частот появления символов в данном тексте с последующим определением вероятности их появления. Во-первых, это создает дополнительные трудности. Во-вторых, в разных текстах одни и те же символы будут закодированы по-разному. В-третьих, закодированный текст передается вместе с кодовой таблицей данных символов, что увеличивает объем передаваемой информации.The following methods of information compression are known: delta coding [1], the Lempel-Ziv-Welch algorithm [2], Huffman coding [1], arithmetic coding [3], etc. In delta coding, differences between serial data are used instead of the data itself . This helps in the case of further compression of this data, in which duplicate values are often found, and is not very useful in the case when it is used by itself. The Lempel-Ziv-Welch algorithm during compression dynamically creates a string conversion table. For each case, it is individual. When coding by the Huffman method and arithmetic coding, it is necessary to analyze the text in order to determine the frequency of occurrence of characters in this text with the subsequent determination of the probability of their occurrence. Firstly, this creates additional difficulties. Secondly, in different texts the same characters will be encoded differently. Thirdly, the encoded text is transmitted along with the code table of these symbols, which increases the amount of information transmitted.
Ни один из перечисленных способов сжатия информации не обладает универсальностью, непосредственностью и возможностью сжатия не только по числу двоичных элементов кода, но и числа символов букв в сообщении.None of the listed methods of information compression has universality, spontaneity and the ability to compress not only by the number of binary code elements, but also by the number of characters of letters in the message.
Технический результат предполагаемого изобретения заключается в обеспечении повышения эффективности, универсальной сущности сжатия информации без потери.The technical result of the proposed invention is to provide increased efficiency, the universal essence of information compression without loss.
Поставленная цель достигается тем, что кодируемые символы (элементы алфавита сообщений) размещают в узлах матрицы. Для кодирования символов используют кодовое представление порядковых номеров строк и столбцов матрицы, на пересечении которых расположены символы сообщения. Пример расположения кодируемых символов представлен на фиг.1 и 2.This goal is achieved by the fact that the encoded characters (elements of the message alphabet) are placed in the nodes of the matrix. To encode characters, use the code representation of the row and column numbers of the matrix, at the intersection of which are the message characters. An example of the location of the encoded characters is presented in figures 1 and 2.
Способ осуществляется следующим образом. Кодируемые символы размещают в узлах матрицы размерностью m×n (фиг.1). Максимальное число кодируемых символов N=m·n. Порядковые номера строк и столбцов матрицы представляют в двоичном виде: 000, 001, 010… и т.д. Совокупность кода строки и кода столбца, на пересечении которых расположен символ, есть кодовое представление данного символа. Например, код символа z23 будет представлять собой комбинацию 010011. При кодировании какого-либо сообщения каждый элемент данного сообщения представляют соответствующим кодом. Например, кодовая комбинация символов сообщения z21z20z23 будет иметь вид 010001010000010011. При наличии в сообщении группы нескольких последовательно расположенных символов, находящихся на одной строке (одном столбце) матрицы, данная группа символов образует общий код, состоящий из кода общей строки и кодов столбцов (из кода общего столбца и кодов строк). Причем элементы общего кода группы символов располагают последовательно с выделением кода строки от кодов столбцов (кода столбца от кодов строк) по тому или иному признаку: изменение полярности, амплитуды, частоты, фазы электрических сигналов. Например, кодовая комбинация символов сообщения z21z20z23 будет иметь вид 010001010000010011 в промежуточном варианте и окончательно 010001000011. Это позволяет более компактно сжать необходимую информацию.The method is as follows. The encoded characters are placed in the nodes of the matrix dimension m × n (figure 1). The maximum number of encoded characters is N = m · n. The serial numbers of the rows and columns of the matrix are represented in binary form: 000, 001, 010 ... etc. The combination of row code and column code, at the intersection of which the symbol is located, is the code representation of this symbol. For example, the character code z 23 will be a combination of 010 011. When encoding a message, each element of this message is represented by a corresponding code. For example, the code combination of characters of the message z 21 z 20 z 23 will have the form 010 001 010 000 010 011. If there are several consecutive characters in the message on the same row (one column) of the matrix, this group of characters forms a common code consisting of from the common row code and column codes (from the common column code and row codes). Moreover, the elements of a common code of a group of symbols are arranged sequentially with the allocation of a row code from column codes (a column code from row codes) according to one or another sign: a change in polarity, amplitude, frequency, phase of electrical signals. For example, the code combination of the message symbols z 21 z 20 z 23 will look like 010 001 010 000 010 011 in the intermediate version and finally 010 001000011. This allows for more compact compression of the necessary information.
Пример 1. Разместим в узлах матрицы размерностью 4×4 буквы русского алфавита (фиг.2). Далее закодируем предлагаемым способом слово «зима». Получим промежуточный результат 1001100001010100 и окончательно 100100010100. В данном случае кодовая комбинация сократилась с 16 до 12 знаков.Example 1. We place in the nodes of the matrix dimension 4 × 4 letters of the Russian alphabet (figure 2). Next, we encode the word "winter" in the proposed way. We get the
Составленную матрицу можно использовать для кодирования любой информации, содержащей символы, расположенные в узлах данной матрицы. Матрицу можно расширить до необходимой размерности m×n, чтобы поместить в ее узлы все символы, которые используются для передачи соответствующей информации.The compiled matrix can be used to encode any information containing characters located in the nodes of this matrix. The matrix can be expanded to the required dimension m × n to place in its nodes all the symbols that are used to transmit the corresponding information.
Таким образом предлагаемый способ обеспечивает универсальное и непосредственное сжатие информации без потерь с возможностью сжатия не только по числу двоичных элементов кода, но и числа символов букв в сообщении.Thus, the proposed method provides universal and direct compression of lossless information with the ability to compress not only the number of binary code elements, but also the number of characters of letters in the message.
Возможна следующая техническая реализация данного способа сжатия информации (фиг.3). Через каждый узел матрицы проходит 3 разновидности шин: общая шина сообщений и координатные шины - шины x и шины y. В каждом узле матрицы расположен регистр кода (память) сообщения и элемент «И», на один вход которого подается код сжимаемого сообщения S и на другой вход подается код сообщения, хранимый в регистре данного узла (фиг.4). При совпадении этих двух кодов на выходе элемента «И» формируется единица, которая поступает на координатные шины x и y, и осуществляет через элементы «И» включение триггеров и регистра данной шины x и регистра данной шины y. С одного выхода триггера поступает сигнал на второй вход элемента «И» данного триггера, а с другого входа снимается код адреса данной шины. При поступлении следующего сообщения, код которого находится в регистре узла, связанного с этой же шиной, вызывающего появление единицы, переключение триггера уже не происходит. При поступлении нескольких единиц последовательно на данный триггер с выхода мы снимаем не совокупность кодов адреса триггера, а всего лишь один код (эффект сжатия). При поступлении нового сообщения, код которого отличается от предыдущего и единицы будут расположены в других шинах, происходит включение других триггеров и сброс ранее включенных триггеров. На выходе регистра шины сообщения происходит запись кодовой комбинации S' из кодов адресов x и кодов адресов y. На приемной стороне принятая сжатая комбинация вновь воспроизводится в исходную.The following technical implementation of this method of information compression is possible (figure 3). Through each node of the
Источники информацииInformation sources
1. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. - М.: ДИАЛОГ-МИФИ, 2003. - 384 с.1. Data compression methods. The device archivers, image and video compression. Vatolin D., Ratushnyak A., Smirnov M., Yukin V. - M .: DIALOG-MEPhI, 2003 .-- 384 p.
2. Основы кодирования. Вернер М. - М.: Техносфера, 2004. - 288 с.2. The basics of coding. Werner, M. - M .: Technosphere, 2004 .-- 288 p.
3. Теория информации. Кодирование дискретных вероятностных источников. Учебное пособие. В.Н.Потапов. Новосибирск. 1999. - 71 с.3. Theory of information. Coding of discrete probabilistic sources. Tutorial. V.N. Potapov. Novosibirsk 1999 .-- 71 p.
Claims (1)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2010111201/09A RU2431918C1 (en) | 2010-03-23 | 2010-03-23 | Method of compressing information |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2010111201/09A RU2431918C1 (en) | 2010-03-23 | 2010-03-23 | Method of compressing information |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2431918C1 true RU2431918C1 (en) | 2011-10-20 |
Family
ID=44999303
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2010111201/09A RU2431918C1 (en) | 2010-03-23 | 2010-03-23 | Method of compressing information |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2431918C1 (en) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000022610A1 (en) * | 1998-10-13 | 2000-04-20 | Nokia Mobile Phones Limited | Speech parameter compression |
| US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
| RU2195714C1 (en) * | 2001-04-28 | 2002-12-27 | Военный университет связи | Voice message compression and recovery method |
| WO2003063360A1 (en) * | 2002-01-22 | 2003-07-31 | Nokia Corporation | Adaptive variable length coding |
| RU2288547C1 (en) * | 2005-05-19 | 2006-11-27 | ВОЕННАЯ АКАДЕМИЯ СВЯЗИ им. С.М. Буденого | Message compression and recovery method |
-
2010
- 2010-03-23 RU RU2010111201/09A patent/RU2431918C1/en not_active IP Right Cessation
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000022610A1 (en) * | 1998-10-13 | 2000-04-20 | Nokia Mobile Phones Limited | Speech parameter compression |
| US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
| RU2195714C1 (en) * | 2001-04-28 | 2002-12-27 | Военный университет связи | Voice message compression and recovery method |
| WO2003063360A1 (en) * | 2002-01-22 | 2003-07-31 | Nokia Corporation | Adaptive variable length coding |
| RU2288547C1 (en) * | 2005-05-19 | 2006-11-27 | ВОЕННАЯ АКАДЕМИЯ СВЯЗИ им. С.М. Буденого | Message compression and recovery method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Roman | Coding and information theory | |
| Porwal et al. | Data compression methodologies for lossless data and comparison between algorithms | |
| Welsh | Codes and cryptography | |
| KR950026293A (en) | Binarization Apparatus and Method for Compression of Color Image and Bitwise Coding of M Alphabets therefor | |
| US7026962B1 (en) | Text compression method and apparatus | |
| DE69904621D1 (en) | METHOD FOR RESTORING LOST INFORMATION PACKAGES IN PACKET TRANSFER PROTOCOLS | |
| KR940006020A (en) | Decoding apparatus for signals encoded with variable length code | |
| CN101496288A (en) | data compression | |
| US9077441B2 (en) | System and method of using variable pulses for symbology | |
| RU2431918C1 (en) | Method of compressing information | |
| KR920003293A (en) | Code modulation device | |
| CN108429553B (en) | Encoding method, encoding device and equipment of polarization code | |
| Gonzalez | The mathematical structure of the genetic code | |
| CN114928363A (en) | Data processing method, data processing device, computer equipment and storage medium | |
| DE60038924D1 (en) | CODING / DECODING N-BIT SOURCED WORDS IN CORRESPONDING M-BIT CHANNEL WORDS, AND VICE INVERTED THAT THE PARITY IS REVERSED BY THE IMPLEMENTATION | |
| CN1937582A (en) | Method for preprocessing data to be compressed and compressed data transmission method | |
| RU2437148C1 (en) | Method to compress and to restore messages in systems of text information processing, transfer and storage | |
| CN103138766A (en) | Method and device of compression and decompression of data | |
| JPH04252329A (en) | Method for displaying data with variable bit pattern and communication system | |
| KR100636370B1 (en) | Encoding device and method thereof using decision bit, and decoding device and method thereof | |
| Singla et al. | Data compression modelling: Huffman and Arithmetic | |
| Jaradat et al. | A Simple Binary Run‐Length Compression Technique for Non‐Binary Sources Based on Source Mapping | |
| CN106877975B (en) | Hard decision joint decoding method in distributed storage capable of zigzag decoding | |
| PETERSEN | Notes on Shannon’s Information Theory | |
| Mandal | An approach towards development of efficient data compression algorithms and correction techniques |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20120324 |