Содержание:
- 1 Найти латиницу в Excel — функция
- 2 Найти кириллицу в Excel — функция
- 3 Как найти прописные буквы
- 4 Функции «Найти латиницу» и «Найти кириллицу» с помощью UDF в VBA
- 5 Найти латинские буквы в 2 клика
- 6 Найти слова, содержащие и кириллицу, и латиницу
- 7 Кейсы дальнейшего взаимодействия с данными
- 8 Подсветка в тексте символов букв русской или английской раскладки
С помощью этой страницы можно проверить, есть ли в тексте символы из другой раскладки.
Для проверки наличия в вашем тексте символов из другого языка — скопируйте исходный текст, вставьте его в поле ниже, и выберите нужный чекбокс языка. При выборе "английский" — будут подсвечены кириллические символы в тексте, и наоборот.
Важно: поскольку термин «найти» часто в сознании людей предполагает «найти и извлечь», сразу оговоримся, что ниже именно булевая интерпретация поиска, иначе говоря, результата два — нашел или не нашел. Похожая, но все же другая задача — извлечь символы латиницы.
Обнаружить латиницу — желаемый результат
Текст, содержащий латиницу помимо кириллицы — довольно частое явление. Примеров, когда нужно обнаружить латиницу среди кириллических символов, или наоборот — кириллицу в английском тексте, довольно много. Объединяет их все одна проблема.
Задача поиска букв латинского алфавита в тексте — одна из нетривиальных в Excel, как и поиска любой длинной последовательности единичных символов. Как и в случае с поиском цифр, при обычном поиске придется перебирать все латинские буквы — а их 26, что еще больше, чем цифр.
Вариантов упростить и ускорить решение задачи — несколько:
Найти латиницу в Excel — функция
Составная функция пригодится в случаях, когда не хочется или нет возможности пользоваться макросами или пользовательскими функциями (UDF):
Здесь A1 — ячейка, которую мы хотим «проверить» на наличие в ней латиницы. Функция возвращает «ИСТИНА» или «ЛОЖЬ».
Важно отметить, что функция «ПОИСК» не является регистрозависимой, поэтому позволяет найти буквы в любом регистре.
Найти кириллицу в Excel — функция
Как вы, наверное, догадались, найти кириллицу в тексте можно аналогичным путем:
Как найти прописные буквы
В отличие от «ПОИСК», НАЙТИ — функция регистрозависимая, что позволяет найти буквы в том регистре, в котором они перечислены.
Функция поиска прописных символов латиницы
Функция поиска прописных кириллических символов
Функция поиска любых прописных символов
Поможет вам найти в ячейке симолы и кириллицы, и латиницы, если они написаны заглавными буквами.
Для поиска цифр в ячейке можно использовать такой же синтаксис.
Функции «Найти латиницу» и «Найти кириллицу» с помощью UDF в VBA
UDF (User-defined function, пользовательская функция) — для тех, кто часто использует функции такого плана, помогут упростить синтаксис на листе, т.к. содержат калькуляции в коде VBA.
Найти латинские буквы в 2 клика
Максимально быстрый способ проверки на наличие латиницы в Excel — доступен пользователям !SEMTools.
Порядок действий — скопировать диапазон, выделить скопированное и вызвать макрос в меню «Найти символы» группы «ОБНАРУЖИТЬ»
Найти латиницу в ячейках Excel без использования формул, с помощью надстройки !SEMTools
Найти слова, содержащие и кириллицу, и латиницу
Иногда простой поиск в ячейке латиницы и кириллицы не решает проблему, т.к. в ячейке изначально подразумевается наличие обоих видов символов. Например, «автомобиль Tоyоta», «холодильник Siеmеns». В двух этих примерах специально вставлены буквы из другого алфавита — Tоyоta содержит кириллическую «О», а Siеmеns — кириллическую «e». Начертание этих символов идентичное, но вот для роботов это совершенно разные символы.
Как с помощью Excel проверить отличие в написании букв на латинице или кириллице в отдельных словах? Формулы выше не отличат фразы, написанные корректно, от фраз, написанных некорректно, так как отдадут «ИСТИНА» всем фразам при проверке на кириллицу и латиницу.
Решить проблему можно, если искать по конкретным словам! В !SEMTools есть два решения этой задачи:
С помощью регулярных выражений
Процедура находится в меню «ОБНАРУЖИТЬ» — «Слова» — «По паттерну». Паттерн REGEX позволяет решить задачу в один заход, т.к. в нем есть оператор «ИЛИ».
Данное выражение означает, что нужно найти слова, в которых или после кириллического символа идет символ латиницы, или наоборот. При этом между символами могут быть внутри слова любые другие символы (цифры, дефисы и любые другие кроме пробела).
Важно понимать, что сам паттерн применим к любой строке, вне зависимости от количества слов в ней, но в рамках указанной процедуры !SEMTools применяется к отдельным словам.
Применяем регулярное выражение из этой статьи для поиска слов, содержащих кириллицу и латиницу
В две итерации
Данный метод совершенно логичен, но требует чуть больше времени. Нужно просто сначала извлечь слова, содержащие латиницу, а потом, уже среди извлеченных этим способом, — искать слова, содержащие кириллицу.
Кейсы дальнейшего взаимодействия с данными
Найти слова, содержащие кириллицу, латиницу или оба вида символов одновременно — только полдела. За этапом их обнаружения зачастую следуют дальнейшие действия.
Удалить
Иногда нужно удалить слова, содержащие латиницу.
Извлечь
Можно захотеть извлечь слова, содержащие латиницу — чтобы посчитать количество слов и посмотреть на их структуру. Из каталога товаров, например, быстро извлекать бренды, написанные на английском языке.
Изменить регистр
Бывают ситуации, когда слова, содержащие латиницу, имеет смысл сделать с заглавной буквы — это касается все тех же иностранных брендов.
Заменить символы
И, наконец, бывают ситуации, когда нужно преобразовать кириллицу в латиницу — но и здесь возможны вариации — можно транслитерировать, сменить раскладку или заменить символы на схожие с ними на другом языке. Подробнее по ссылке: заменить кириллицу на латиницу и наоборот
Про каждый из этих кейсов можно почитать с соответствующем разделе — в надстройке присутствуют макросы для быстрой обработки подобных ситуаций
Подсветка в тексте символов букв русской или английской раскладки
(выделение цветом латиницы или кириллицы) в онлайн режиме или
оффлайн окне браузера (JavaScript)
Сегодня потратил больше часа на поиск ошибки в уже работающей программе. Она стала напрочь отказываться работать, после введения довольно большого количества дополнительных поправок. После отключения режима ‘use strict’ что-то заработало, но неправильно, — стало ясно, что ошибка в переменной. но найти ее при проверке переменных так и не удалось. Пришлось постепенно откатывать введенные поправки (по закону подлости почти все), тут и обнаружилось что в одной из переменных "year" вместо "игрек" стояла наша русская "у".
Решил, потрачу часик и сделаю программку подсветки символов, чтобы подобная напасть больше не повторялась. Часик вылился в вечерок, до поздней ночи, но своего я добился, теперь программа подсветки кириллических или латинских символов прямо в браузере, онлайн, у меня под рукой.
Поместил ее в копилке блога, может кому-то еще пригодится:
Подсветка в тексте символов букв русской или английской раскладки
Нужно выделить: Латиницу Кириллицу
Всего знаков: 175 ; знаков c пробелами: 172 ; знаков без пробелов: 147 .
ВНИМАНИЕ! При перезагрузке страницы введенная информация не сохраняется!
Полагаю, что поиск опечаток из-за ошибок переключения раскладки в обычном тексте, тоже может улучшить его качество, хотя здесь чаще всего помогает проверка правописания. А в Word есть еще некий экзотический шрифт, в котором латинские и кириллические символы разительно отличаются друг от друга (названия не помню, но когда-то пользовался. )
Если в тексте много специальных терминов, думаю, что лучше всего провериться здесь.
P.S. 17.04.2018 — Добавлен счетчик знаков в исходном тексте он расположен под боксом проверки символов (в боксе с подсветкой символов rus — eng раскладок знаки не подсчитываются).
"Все знаки" — учитываются все буквы, знаки препинания, пробелы и неотображаемые знаки табуляции;
"знаки с пробелами" — подсчитываются буквы, знаки препинания и пробелы;
"знаки без пробелов" — подсчитываются только буквы и знаки препинания.
В заключение хочется отметить: Важным премуществом предложенной здесь программы является тот факт, что обработка всех данных происходит исключительно на Вашем устройстве с помощью загруженного вместе со страницей безопасного Java Script кода, и вводимая в текст-бокс информация ни на какие сторонние серверы не отправляется, более того, при перезагрузке страницы она полностью стирается. Еще мне понравилась идея визуализации текстовых символов различного назначения и проведения на одной странице различных видов статистической обработки текста. Правда, пока она реализована как дополнение программы подсветки символов простейшим счетчиком знаков в том числе и неотображаемых табуляционных. В случае, если вам необходимая еще какая-то статистическая информация о символах в тексте, например, количество или частота букв "а" или "о", пишите.