Данный калькулятор считает количество бит, которое «весит» текст (слово, строка, предложение и тд.) онлайн.
По-умолчанию подсчет ведется в кодировках UTF-8/cp1251/KOI8/CP866, где один символ, занимает восемь бит. Но можно переключиться в режим подсчета в кодировке UTF-16, где один символ занимает шестнадцать бит. Сделать это можно в поле «Задачи».
Введите текст (любой набор символов) *
Текст
Укажите символы, которые следует убрать из текста
Регистр букв (для уникальных слов и букв)
Выберите информацию, которую хотите получить
* — обязательно заполнить
On x86/x64 processors, a byte is 8 bits, and there are 256 possible binary states in 8 bits, 0 thru 255. This is how the OS translates your keyboard key strokes into letters on the screen. When you press the ‘A‘ key, the keyboard sends a binary signal equal to the number 97 to the computer, and the computer prints a lowercase ‘a‘ on the screen. You can confirm this in any Windows text editing software by holding an ALT key, typing 97 on the NUMPAD, then releasing the ALT key. If you replace ’97’ with any number from 0 to 255, you will see the character associated with that number on the system’s character code page printed on the screen.
If a character is 8 bits, or 1 byte, then a WORD must be at least 2 characters, so 16 bits or 2 bytes. Traditionally, you might think of a word as a varying number of characters, but in a computer, everything that is calculable is based on static rules. Besides, a computer doesn’t know what letters and symbols are, it only knows how to count numbers. So, in computer language, if a WORD is equal to 2 characters, then a double-word, or DWORD, is 2 WORDs, which is the same as 4 characters or bytes, which is equal to 32 bits. Furthermore, a quad-word, or QWORD, is 2 DWORDs, same as 4 WORDs, 8 characters, or 64 bits.
Note that these terms are limited in function to the Windows API for developers, but may appear in other circumstances (eg. the Linux dd command uses numerical suffixes to compound byte and block sizes, where c is 1 byte and w is bytes).
Калькулятор считает, сколько бит занимает введенный текст.
Результат выдается сразу в двух кодировках: UTF-8/cp1251/KOI8/CP866 и UTF-16. В UTF-16 текст занимает в два раза больше места.
Введите текст (любой набор символов) *
Текст
Укажите символы, которые следует убрать из текста
Исключить символы
Регистр букв (для уникальных слов и букв)
Учитывать регистр букв
Выберите информацию, которую хотите получить
Задачи
* — обязательно заполнить
Обратите внимание на другие текстовые калькуляторы: https://calcon.ru/category/text/
Все мы привыкли к тому, что все вокруг можно измерить. Мы можем определить массу посылки, длину стола, скорость движения автомобиля. Но как определить количество информации, содержащееся в сообщении? Ответ на вопрос в статье.
Итак, давайте для начала выберем сообщение. Пусть это будет «Принтер — устройство вывода информации.«. Наша задача — определить, сколько информации содержится в данном сообщении. Иными словами — сколько памяти потребуется для его хранения.
Определение количества информации в сообщении
Для решения задачи нам нужно определить, сколько информации несет один символ сообщения, а потом умножить это значение на количество символов. И если количество символов мы можем посчитать, то вес символа нужно вычислить. Для этого посчитаем количество различных символов в сообщении. Напомню, что знаки препинания, пробел — это тоже символы. Кроме того, если в сообщении встречается одна и та же строчная и прописная буква — мы считаем их как два различных символа. Приступим.
В слове Принтер 6 различных символов (р встречается дважды и считается один раз), далее 7-й символ пробел и девятый — тире. Так как пробел уже был, то после тире мы его не считаем. В слове устройство 10 символов, но различных — 7, так как буквы с, т и о повторяются. Кроме того буквы т и р уже была в слове Принтер. Так что получается, что в слове устройство 5 различных символов. Считая таким образом дальше мы получим, что в сообщении 20 различных символов.
Далее вспомним формулу, которую называют главной формулой информатики:
2i=N
Подставив в нее вместо N количество различных символов, мы узнаем, сколько информации несет один символ в битах. В нашем случае формула будет выглядеть так:
2i=20
Вспомним степени двойки и поймем, что i находится в диапазоне от 4 до 5 (так как 24=16, а 25=32). А так как бит — минимальная единица измерения информации и дробным быть не может, то мы округляем i в большую сторону до 5. Иначе, если принять, что i=4, мы смогли бы закодировать только 24=16 символов, а у нас их 20. Поэтому получаем, что i=5, то есть каждый символ в нашем сообщении несет 5 бит информации.
Осталось посчитать сколько символов в нашем сообщении. Но теперь мы будем считать все символы, не важно повторяются они или нет. Получим, что сообщение состоит из 39 символов. А так как каждый символ — это 5 бит информации, то, умножив 5 на 39 мы получим:
5 бит x 39 символов = 195 бит
Это и есть ответ на вопрос задачи — в сообщении 195 бит информации. И, подводя итог, можно написать алгоритм нахождения объема информации в сообщении:
- посчитать количество различных символов.
- подставив это значение в формулу 2i=N найти вес одного символа (округлив в большую сторону)
- посчитать общее количество символов и умножить это число на вес одного символа.
Автор:
Сколько байтов в слове байт? Сколько байтов в слове бит? А сколько это в битах? Если считать в кодировке Unicode, где длина символа равна 2 байтам, то получаем: в слове «байт» 4 * 2 = 8 байтов (или 64 бита, так как 1 байт равен 8 битам), в слове «бит» 3 * 2 = 6 байтов (или 48 бит) . система выбрала этот ответ лучшим Однозначного ответа нет. Символы могут иметь размер в один байт, два и более байтов. Все определяется используемой системой кодировки символов. Например, в Unicode длина символа два байта. Тогда в первом слове восемь байт, во втором шесть байт, или 64 и 48 бит. Михаил Белодедов 9 лет назад Как правило, текстовая информация кодируется одим из вариантов ASCII-таблицы. В этом случае для слова БАЙТ будет использовано 4 байта, для слова БИТ — 3 байта. Если пользоваться кодом Unicod, то в 2 раза больше — 8 и 6 байт. Bartews 5 лет назад В одном байте 8 бит. В обычной кодировке ANSI один символ занимает один байт. Получается в слове «бит» 3 байта или 24 бита, а в слове «байт» 4 байта или 32 бита. В других кодировках могут быть другие значения. amarcord 9 лет назад Лучше всего убедиться в чём-либо — посмотреть своими глазами. Итак, создаём текстовый документ с расширением .txt. Смотрим свойства только что созданного файла, и видим там ноль байтов. Открываем документ, пишем там слово «байт», документ закрываем, и смотрим в свойствах увеличение размера документа до восьми байтов. Делаем выводы. Как узнать размер слова бит, думаю, теперь не составит труда. Байт может иметь в своём составе не только 8 битов, но и другое их количество, например шесть, или, если угодно будет, и тридцать шесть. Современный байт из восьми битов называется октет. terli4eno4ka 6 лет назад Если мы создадим новым текстовый документ с расширением .txt, закроем и посмотрим его свойства, нам покажет, что он занимает 0 места. Теперь напишем в нем слово «бит» и сохраним его. Показывает, что он занял 3 байта, а на диске 4 КБ. Слово же «байт» занимает 4 байта, а на диске также 4 КБ. Если исходить из того, что в одном байте 8 бит, то получится, что в этих словах соответственно 24 и 32 бит. Но тут все зависит от кодировки. К примеру, в Unicod один символ соответствует двум байтам, следовательно, тогда количество байтов и битов будет отличаться. AlexeyMiKhailovich 6 лет назад Для начала условимся, что в одном байте 8 бит, а значит если мы узнаем сколько байт в словах «байт» и «бит», то умножив результат на 8 мы узнаем сколько в этих же словах бит. Один символ может быть записан в 2 байтах. Так как в слове «байт» 4 буквы, а значит и символа, делаем вывод в нем 2*4=8 байт или 8*8=64 бит. Тоже самое и со словом «бит». Smiledimasik 6 лет назад Начнем со слова «бит». Я ввел его в текстовом блокноте и у меня получилось 5 байт, с этого выходит что битов в нем 45 если что. Теперь слово «байт» и как не странно почему то показало что размер 4 байта. Так же стоит отметить, что когда я ввел эти слова, то место на диске они занимали уже не в байтах, а килобайтах. Глобальный предиктор 8 лет назад тут все зависит от кодировки. если мы используем для кодировки ASCII таблицу, то получается, что для слова «байт» использовано 4 байта, для слова «бит» 3 байта. если же мы для кодировки каждого символа используем юникод, то для слова «байт» будет 8 байт, для слова «бит» 6 байт. Знаете ответ? |