{"draftJsState":{"blocks":[{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Проверяем двоичные деревья на симметричность, вычисляем расстояние Дамерау-Левенштейна и оцениваем сложность алгоритмов.","type":"unstyled","key":"d582g"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Задание 1","type":"header-two","key":"74osl"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":11,"offset":46,"style":"BOLD"},{"length":16,"offset":116,"style":"BOLD"},{"length":3,"offset":163,"style":"BOLD"},{"length":4,"offset":193,"style":"BOLD"},{"length":4,"offset":205,"style":"BOLD"},{"length":4,"offset":214,"style":"BOLD"}],"text":"Напишите программу, которая принимает на вход целое число, и возвращает целое число, цифры в котором переставлены в обратном порядке. Например, если введено число 561, программа должна вернуть 165, а если -578, то -875. Решите задачу двумя способами – с использованием методов строк и без. Какое решение более эффективно?","type":"unstyled","key":"aflp2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение","type":"header-three","key":"7imhv"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"При использовании методов строк задача решается максимально просто:","type":"unstyled","key":"283l3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def reverse_integer(num):\n num_str = str(num)\n if num_str[0] == \"-\":\n reverse_str = \"-\" + num_str[:0:-1] \n else:\n reverse_str = num_str[::-1]\n","type":"atomic","key":"7skkm"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":5,"offset":57,"style":"BOLD"},{"length":13,"offset":107,"style":"BOLD"}],"text":"Для решения без использования строк нужно запустить цикл while, который будет выполняться до тех пор, пока num_remaining не станет равным нулю. В каждой итерации цикла происходит следующее:","type":"unstyled","key":"ael94"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":8,"offset":8,"style":"BOLD"},{"length":2,"offset":19,"style":"BOLD"},{"length":13,"offset":61,"style":"BOLD"},{"length":2,"offset":78,"style":"BOLD"},{"length":13,"offset":119,"style":"BOLD"},{"length":6,"offset":164,"style":"BOLD"}],"text":"Умножаем result на 10 и прибавляем к нему остаток от деления num_remaining на 10 (таким образом, последняя цифра числа num_remaining становится первой цифрой числа result).","type":"unordered-list-item","key":"e81p3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":13,"offset":6,"style":"BOLD"},{"length":2,"offset":38,"style":"BOLD"}],"text":"Затем num_remaining делится нацело на 10, чтобы удалить последнюю цифру.","type":"unordered-list-item","key":"6vl3i"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":7,"offset":43,"style":"BOLD"},{"length":7,"offset":119,"style":"BOLD"}],"text":"После окончания цикла возвращается значение result, причем если исходное число num было отрицательным, то возвращается -result.","type":"unordered-list-item","key":"fq8se"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":15,"style":"BOLD"},{"length":3,"offset":25,"style":"BOLD"},{"length":7,"offset":57,"style":"BOLD"},{"length":1,"offset":78,"style":"BOLD"},{"length":13,"offset":83,"style":"BOLD"},{"length":2,"offset":111,"style":"BOLD"},{"length":7,"offset":134,"style":"BOLD"},{"length":2,"offset":155,"style":"BOLD"},{"length":13,"offset":161,"style":"BOLD"},{"length":1,"offset":189,"style":"BOLD"},{"length":6,"offset":211,"style":"BOLD"},{"length":3,"offset":232,"style":"BOLD"},{"length":13,"offset":239,"style":"BOLD"},{"length":1,"offset":267,"style":"BOLD"},{"length":3,"offset":332,"style":"BOLD"},{"length":4,"offset":373,"style":"BOLD"},{"length":1,"offset":383,"style":"BOLD"}],"text":"Например, если num равно 123, то в первой итерации цикла result станет равным 3, а num_remaining станет равным 12. Во второй итерации result станет равным 32, а num_remaining станет равным 1. В третьей итерации result станет равным 321, а num_remaining станет равным 0, что приведет к завершению цикла. В итоге функция вернет число 321. Временная сложность этого решения – O(n), где n равно числу цифр в числе:","type":"unstyled","key":"e3utm"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def reverse_integer(num):\n result, num_remaining = 0, abs(num)\n while num_remaining:\n result = result * 10 + num_remaining % 10\n num_remaining //= 10\n return -result if num < 0 else result\n","type":"atomic","key":"327ee"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Сравним быстродействие решений:","type":"unstyled","key":"66uht"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import timeit\n\ndef reverse_integer_1(num):\n result, num_remaining = 0, abs(num)\n while num_remaining:\n result = result * 10 + num_remaining % 10\n num_remaining //= 10\n return -result if num < 0 else result\n\ndef reverse_integer_2(num):\n num_str = str(num)\n if num_str[0] == \"-\":\n reverse_str = \"-\" + num_str[:0:-1] \n else:\n reverse_str = num_str[::-1]\n return int(reverse_str)\n\n# Тестируем на случайном числе из 10000 цифр\nnum = int(\"\".join(str(i % 10) for i in range(10000)))\n\n# Сравниваем время выполнения двух функций\nt1 = timeit.timeit(lambda: reverse_integer_1(num), number=100)\nt2 = timeit.timeit(lambda: reverse_integer_2(num), number=100)\nprint(f\"Время выполнения решения с циклом: {t1:.6f} секунд\")\nprint(f\"Время выполнения с методом строк: {t2:.6f} секунд\")\n","type":"atomic","key":"fr0t8"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение, использующее методы строк, работает заметно быстрее:","type":"unstyled","key":"c9hc"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Время выполнения решения с циклом: 9.354593 секунд\nВремя выполнения с методом строк: 0.213387 секунд\n","type":"atomic","key":"148d7"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Это связано с тем, что встроенная функция [::-1] для инвертирования строки в Python реализована на C-уровне и оптимизирована для работы с символами.","type":"unstyled","key":"3ugk3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\uD83D\uDC0D Библиотека питониста","type":"unstyled","key":"d3aaq"},{"data":{},"depth":0,"entityRanges":[{"key":0,"length":22,"offset":63}],"inlineStyleRanges":[],"text":"Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека питониста»","type":"unstyled","key":"m7j"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\uD83D\uDC0D\uD83D\uDCBC Библиотека собеса по Python","type":"unstyled","key":"fhafl"},{"data":{},"depth":0,"entityRanges":[{"key":1,"length":29,"offset":67}],"inlineStyleRanges":[],"text":"Подтянуть свои знания по Python вы можете на нашем телеграм-канале «Библиотека собеса по Python»","type":"unstyled","key":"a9kad"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\uD83E\uDDE9\uD83D\uDC0D Библиотека задач по Python","type":"unstyled","key":"ffuel"},{"data":{},"depth":0,"entityRanges":[{"key":2,"length":28,"offset":78}],"inlineStyleRanges":[],"text":"Интересные задачи по Python для практики можно найти на нашем телеграм-канале «Библиотека задач по Python»","type":"unstyled","key":"4s7ke"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Задание 2","type":"header-two","key":"uupf"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":29,"style":"BOLD"},{"length":1,"offset":34,"style":"BOLD"},{"length":1,"offset":41,"style":"BOLD"},{"length":1,"offset":45,"style":"BOLD"},{"length":10,"offset":76,"style":"BOLD"}],"text":"Вычислите частное от деления x на y, где х и y – целые положительные числа. Допустимые операции – сложение, вычитание и побитовый сдвиг.","type":"unstyled","key":"52dhv"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение","type":"header-three","key":"bt6i3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":57,"style":"BOLD"},{"length":2,"offset":81,"style":"BOLD"},{"length":1,"offset":130,"style":"BOLD"},{"length":7,"offset":222,"style":"BOLD"}],"text":"Это задачка с подвохом – простейшее решение, при котором y в цикле вычитается из x до тех пор, пока остаток не станет меньше, чем y, окажется самым затратным. Например, если y = 1, a x = 231 –1, для вычисления потребуется 231 – 1 итераций:","type":"unstyled","key":"ei9t6"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def divide(x, y):\n quotient = 0\n remainder = x\n while remainder >= y:\n remainder -= y\n quotient += 1\n return quotient\n","type":"atomic","key":"ajst1"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Более оптимальный подход:","type":"unstyled","key":"82mdj"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":23,"style":"BOLD"},{"length":9,"offset":38,"style":"BOLD"}],"text":"Найти наибольшее число k, при котором 2k y <= x.","type":"unordered-list-item","key":"2qegu"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":4,"offset":8,"style":"BOLD"},{"length":1,"offset":16,"style":"BOLD"}],"text":"Вычесть 2k y из x.","type":"unordered-list-item","key":"4st2v"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":9,"style":"BOLD"}],"text":"Добавить 2k к частному.","type":"unordered-list-item","key":"fmlc5"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"К примеру, если х = (1011)2 и y = (10)2, то k = 2, поскольку 2 * 22 <= 11 и 2 * 23 > 11. Мы вычитаем (1000)2 из (1011)2, получаем (11)2, добавляем 2k = 22 = (100)2 к частному, и обновляем значение x = (11)2.","type":"unstyled","key":"7v9ln"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":126,"style":"BOLD"},{"length":1,"offset":276,"style":"BOLD"},{"length":3,"offset":280,"style":"BOLD"},{"length":1,"offset":295,"style":"BOLD"},{"length":4,"offset":334,"style":"BOLD"},{"length":6,"offset":494,"style":"BOLD"}],"text":"Главные преимущества при использовании 2k y – это значение очень эффективно вычисляется с помощью битового сдвига, а значение x уменьшается по крайней мере вдвое с каждой итерацией. Однако наш алгоритм все еще далек от совершенства: если для представления частного от деления x на y потребуется n битов, вычисление будет завершено за O(n) итераций. Если наибольшее k, при котором 2k y <= x, вычисляется итеративно через k, каждая итерация имеет временную сложность O(n), что в итоге приведет к O(n2) алгоритму.","type":"unstyled","key":"9g9sk"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":1,"offset":31,"style":"BOLD"},{"length":1,"offset":181,"style":"BOLD"},{"length":1,"offset":262,"style":"BOLD"}],"text":"Более эффективный способ найти k в каждой итерации – учесть, что k последовательно уменьшается. То есть вместо того, чтобы каждый раз проверять, что 20y, 21y, 22y меньше либо равно x, после первого обнаружения k, при котором 2k y <= x, в последующих итерациях с x нужно сравнивать 2k-1y, 2k-2, 2k-3y и так далее.","type":"unstyled","key":"5md93"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":4,"offset":706,"style":"BOLD"}],"text":"В приведенном выше примере после обнаружения первого k значение частного равно (100)2 к, а x = (11)2. Теперь наибольшее число k, при котором 2k y <= (11)2 равно 0, поэтому мы добавляем 20 = (1)2 к частному, которое после этого будет равно (101)2. Продолжаем цикл с (11)2 – (10)2 = (1)2. Поскольку (1)2 < y, вычисление завершается – частное равно (101)2, остаток равен (1)2. По сути, оптимальное решение применяет деление путем вычитания к двоичным числам и обрабатывает дополнительный бит с каждой новой итерацией. Мы используем сдвиг влево на power разрядов, так как это соответствует умножению на 2**power. Предполагая, что сдвиг и операция сложения занимают О(1), получим решение с временной сложностью O(n):","type":"unstyled","key":"960ai"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def divide (x, y):\n result, power = 0, 32\n y_power = y << power\n while x >= y:\n while y_power > x:\n y_power >>= 1\n power -= 1\n result += 1 << power\n x -= y_power\n return result\n","type":"atomic","key":"4eilh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Сравним время выполнения брутфорсного и оптимизированного алгоритмов:","type":"unstyled","key":"60akq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import timeit\n\ndef divide_1(x, y):\n quotient = 0\n remainder = x\n while remainder >= y:\n remainder -= y\n quotient += 1\n return quotient\n\ndef divide_2(x, y):\n result, power = 0, 32\n y_power = y << power\n while x >= y:\n while y_power > x:\n y_power >>= 1\n power -= 1\n result += 1 << power\n x -= y_power\n return result\n\nx, y = 1000000, 7\ntime_1 = timeit.timeit(lambda: divide_1(x, y), number=1000)\ntime_2 = timeit.timeit(lambda: divide_2(x, y), number=1000)\nprint(f\"Время выполнения брутфорсного алгоритма: {time_1}\")\nprint(f\"Время выполнения оптимизированного алгоритма: {time_2}\")\n","type":"atomic","key":"5l1ak"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Результат:","type":"unstyled","key":"v0t3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Время выполнения брутфорсного алгоритма: 9.041366940829903\nВремя выполнения оптимизированного алгоритма: 0.003612866159528494\n","type":"atomic","key":"6oifh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\uD83D\uDCBC Вакансии по Python, Django, Flask","type":"unstyled","key":"86l0t"},{"data":{},"depth":0,"entityRanges":[{"key":3,"length":9,"offset":31}],"inlineStyleRanges":[],"text":"Лучшие вакансии из мира Python @pydevjob","type":"unstyled","key":"4u87u"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Задание 3","type":"header-two","key":"at4bq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":4,"offset":14,"style":"BOLD"},{"length":2,"offset":31,"style":"BOLD"},{"length":7,"offset":78,"style":"BOLD"},{"length":2,"offset":96,"style":"BOLD"},{"length":4,"offset":101,"style":"BOLD"}],"text":"Имеются текст text и подстрока st. Напишите программу, которая находит индекс первого вхождения st в text.","type":"unstyled","key":"c05fd"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение","type":"header-three","key":"acg03"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Брутфорсный подход – создать вложенный цикл:","type":"unstyled","key":"deruj"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def find_st(text, st):\n n = len(text)\n m = len(st)\n for i in range(n - m + 1):\n j = 0\n while j < m and text[i+j] == st[j]:\n j += 1\n if j == m:\n return i\n return -1\n","type":"atomic","key":"ba63b"},{"data":{},"depth":0,"entityRanges":[{"key":4,"length":23,"offset":229}],"inlineStyleRanges":[{"length":5,"offset":36,"style":"BOLD"},{"length":2,"offset":47,"style":"BOLD"},{"length":1,"offset":67,"style":"BOLD"}],"text":"Временная сложность этого алгоритма O(nm), где n – длина текста, а m – длина подстроки. Эффективнее использовать один из специальных алгоритмов поиска подстроки – Бойера-Мура, Рабина-Карпа или Кнута-Морриса-Пратта. Воспользуемся алгоритмом Рабина-Карпа – его преимущество в том, что хеши вычисляются очень быстро, а сравнивать строки приходится только при совпадении хешей. Это значительно ускоряет поиск по сравнению с перебором всех срезов подряд:","type":"unstyled","key":"90ls2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import functools\n\ndef rabin_karp(text, st):\n if len(st) > len(text):\n return -1 \n BASE = 33\n text_hash = functools.reduce(lambda h, c: h * BASE + ord(c), text[:len(st)], 0)\n st_hash = functools.reduce(lambda h, c: h * BASE + ord(c), st, 0)\n power_st = BASE**max(len(st) - 1, 0) \n for i in range(len(st), len(text)):\n if text_hash == st_hash and text[i - len(st):i] == st:\n return i - len(st) \n text_hash -= ord(text[i - len(st)]) * power_st\n text_hash = text_hash * BASE + ord(text[i])\n if text_hash == st_hash and text[-len(st):] == st:\n return len(text) - len(st)\n return -1 \n\ntext = \"В роще-чаще рыщет ящер, ищет пищи подходящей\"\nst = \"ще\"\nprint(rabin_karp(text, st))\n","type":"atomic","key":"bci26"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Вывод:","type":"unstyled","key":"ff22n"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"4\n","type":"atomic","key":"4vub2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":6,"offset":83,"style":"BOLD"}],"text":"При условии правильного выбора хеш-функции временная сложность этого решения равна O(n+m).","type":"unstyled","key":"9qs8l"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Задание 4","type":"header-two","key":"3nufv"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Напишите функцию для проверки симметричности двоичного дерева. Примеры деревьев:","type":"unstyled","key":"dnvoq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Дерево 1:\n 1\n / \\\n / \\\n 2 2\n / \\ / \\\n 3 4 4 3\n\nДерево 2:\n 1\n / \\\n / \\\n 2 2\n / \\ / \\\n 3 5 6 3\n\nДерево 3:\n 1\n / \\\n / \\\n 2 2\n / \\\n 5 5\n","type":"atomic","key":"egjj6"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Первое и третье деревья симметричны, а второе – нет.","type":"unstyled","key":"f1js"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение","type":"header-three","key":"4u6a9"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":4,"offset":314,"style":"BOLD"},{"length":1,"offset":324,"style":"BOLD"},{"length":4,"offset":482,"style":"BOLD"},{"length":4,"offset":509,"style":"BOLD"},{"length":1,"offset":519,"style":"BOLD"}],"text":"В соответствии с условием симметричным деревом считается дерево, которое симметрично и с точки зрения структуры, и с точки зрения значений узлов. Чтобы проверить дерево на симметричность, можно создать его зеркальное отражение и сравнить его с оригиналом. Временная и пространственная сложность такого алгоритма – O(n), где n – число узлов. Проверку можно оптимизировать, если вместо создания отражения целого дерева сравнивать пары поддеревьев – временная сложность такого подхода O(n), а пространственная – O(h), где h – высота дерева:","type":"unstyled","key":"dl0l"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def is_tree_symmetric(tree):\n def check_symmetric(subtree_0, subtree_1):\n if not subtree_0 and not subtree_1:\n return True\n elif subtree_0 and subtree_1:\n return (subtree_0.data == subtree_1.data\n and check_symmetric(subtree_0.left, subtree_1.right)\n and check_symmetric(subtree_0.right, subtree_1.left))\n return False\n return not tree or check_symmetric(tree.left, tree.right)\n","type":"atomic","key":"7t2m"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Пример использования с заданными в условии деревьями:","type":"unstyled","key":"2ed6v"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"from collections import namedtuple\nNode = namedtuple('Node', ['data', 'left', 'right'])\n\ntree1 = Node(1, Node(2, Node(3, None, None), Node(4, None, None)), Node(2, Node(4, None, None), Node(3, None, None)))\ntree2 = Node(1, Node(2, Node(3, None, None), Node(5, None, None)), Node(2, Node(6, None, None), Node(3, None, None)))\ntree3 = Node(1, Node(2, Node(5, None, None), None), Node(2, None, Node(5, None, None)))\n \nfor t in [tree1, tree2, tree3]:\n print(is_tree_symmetric(t))\n","type":"atomic","key":"bot99"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Вывод:","type":"unstyled","key":"68i00"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"True\nFalse\nTrue\n","type":"atomic","key":"eq8ga"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Задание 5","type":"header-two","key":"8vpj6"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":2,"offset":103,"style":"BOLD"},{"length":2,"offset":115,"style":"BOLD"}],"text":"Напишите программу для подсчета количества правок, которые нужно выполнить, чтобы преобразовать строку S1 в строку S2. Например, для преобразования слова «лимузин» в «лимонад» нужно сделать 4 правки, а для приведения слова «кошка» к слову «кофта» достаточно 2 изменений.","type":"unstyled","key":"4uguv"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Решение","type":"header-three","key":"326i7"},{"data":{},"depth":0,"entityRanges":[{"key":5,"length":41,"offset":245}],"inlineStyleRanges":[{"length":2,"offset":177,"style":"BOLD"}],"text":"Брутфорсный подход – перечислить все строки, отличающиеся на 1, 2, 3 и так далее символов от первой строки, пока не получим вторую строку. В худшем случае нужно будет перебрать 2n вариантов. Более оптимальный подход – воспользоваться алгоритмом вычисления расстояния Дамерау-Левенштейна.","type":"unstyled","key":"4adck"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":22,"offset":0,"style":"BOLD"},{"length":7,"offset":195,"style":"BOLD"},{"length":8,"offset":204,"style":"BOLD"}],"text":"Расстояние Левенштейна, также известное как редакционное расстояние – это метрика, используемая для измерения различий между двумя строками. Расстояние определяет минимальное количество операций вставки, удаления и замены символов, необходимых для преобразования одной строки в другую. Концепция используется в задачах автоматической коррекции орфографии, сравнении текстовых строк и т.п.","type":"unstyled","key":"2bb3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Принцип вычисления расстояния Левенштейна выглядит так:","type":"unstyled","key":"dkgba"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":2,"offset":0,"style":"BOLD"},{"length":3,"offset":34,"style":"BOLD"},{"length":2,"offset":40,"style":"BOLD"},{"length":1,"offset":90,"style":"BOLD"}],"text":"1. Допустим, у нас есть две строки S1 и S2, которые мы хотим сравнить. Мы создаем матрицу M размером (len(S1) + 1) x (len(S2) + 1). Каждая ячейка матрицы M[i][j] будет представлять минимальное расстояние между подстроками S1[0:i] и S2[0:j].","type":"unstyled","key":"assus"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"2. На первом этапе инициализируются первая строка и первый столбец матрицы M: в ячейку M[i][0] помещаем значение i, а в ячейку M[0][j] помещаем значение j, так как для превращения пустой строки в S1 или S2 необходимо выполнить i или j операций вставки или удаления соответственно.","type":"unstyled","key":"diqlu"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":2,"offset":0,"style":"BOLD"}],"text":"3. Затем заполняем оставшуюся часть матрицы M. Для этого рассматриваем каждую пару символов S1[i-1] и S2[j-1]. Если они совпадают, то M[i][j] просто равно M[i-1][j-1], и ничего менять не нужно. В противном случае, M[i][j] равно минимуму из следующих трех значений:","type":"unstyled","key":"998mf"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"M[i-1][j] + 1 (удаление символа из S1)","type":"unordered-list-item","key":"23kkk"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"M[i][j-1] + 1 (вставка символа в S1)","type":"unordered-list-item","key":"1mqdd"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"M[i-1][j-1] + 1 (замена символа в S1 на символ из S2)","type":"unordered-list-item","key":"fvdo9"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Результат – в нижем правом углу матрицы M (M[len(S1)][len(S2)]) окажется минимальное расстояние между строками S1 и S2. Это значение равно минимальному количеству операций вставки, удаления и замены, необходимых для преобразования S1 в S2. Вот так выглядит матрица вычисления расстояния Левенштейна для слов «кошка» и «кофта»:","type":"unstyled","key":"3jc2n"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"| к | о | ф | т | а |\n --------------------------\n | 0 | 1 | 2 | 3 | 4 | 5 |\n-----------------------------\n к | 1 | 0 | 1 | 2 | 3 | 4 |\n-----------------------------\n о | 2 | 1 | 0 | 1 | 2 | 3 |\n-----------------------------\n ш | 3 | 2 | 1 | 1 | 2 | 3 |\n-----------------------------\n к | 4 | 3 | 2 | 2 | 2 | 3 |\n-----------------------------\n а | 5 | 4 | 3 | 3 | 3 | 2 |\n-----------------------------\n","type":"atomic","key":"b2m2k"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":18,"offset":36,"style":"BOLD"}],"text":"Временная сложность этого решения – O(len(s1)*len(s2)):","type":"unstyled","key":"3hngu"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"def levenshtein_distance(S1, S2):\n def fill_matrix(S1_idx, S2_idx):\n if S1_idx < 0:\n return S2_idx + 1\n elif S2_idx < 0:\n return S1_idx + 1\n if M[S1_idx][S2_idx] == -1:\n if S1[S1_idx] == S2[S2_idx]:\n M[S1_idx][S2_idx] = (fill_matrix(S1_idx - 1, S2_idx - 1))\n else:\n substitute_last = fill_matrix(S1_idx - 1, S2_idx - 1)\n add_last = fill_matrix(S1_idx - 1, S2_idx)\n delete_last = fill_matrix(S1_idx, S2_idx - 1)\n M[S1_idx][S2_idx] = (1 + min(substitute_last, add_last, delete_last))\n return M[S1_idx][S2_idx ]\n M = [[-1] * len(S2) for _ in S1]\n return fill_matrix(len(S1) - 1, len(S2) - 1)\nprint(levenshtein_distance('кошка', 'кофта'))\n","type":"atomic","key":"6olgd"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Вывод:","type":"unstyled","key":"4fe2o"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"2\n","type":"atomic","key":"8rhlj"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"***","type":"unstyled","key":"aa8ob"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Материалы по теме","type":"header-two","key":"jbf7"},{"data":{},"depth":0,"entityRanges":[{"key":6,"length":75,"offset":0}],"inlineStyleRanges":[],"text":"\uD83D\uDC0D Функции в Python: 5 задач для тренировки *args, **kwargs и lambda-функций","type":"unordered-list-item","key":"natt"},{"data":{},"depth":0,"entityRanges":[{"key":7,"length":58,"offset":0}],"inlineStyleRanges":[],"text":"6 алгоритмов решения задач по спортивному программированию","type":"unordered-list-item","key":"c1uvg"},{"data":{},"depth":0,"entityRanges":[{"key":8,"length":99,"offset":0}],"inlineStyleRanges":[],"text":"\uD83D\uDC0D\uD83E\uDDE9 Обработка вложенных списков и матриц в Python: 5 задач с решениями для совершенствования навыков","type":"unordered-list-item","key":"5caht"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"marker","key":"vb0R1eWhaPcJas8WflYf"}],"entityMap":{"0":{"data":{"href":"https://proglib.io/w/3ab36fc3","url":"https://proglib.io/w/3ab36fc3"},"mutability":"MUTABLE","type":"LINK"},"1":{"data":{"href":"https://proglib.io/w/07c7f536","url":"https://proglib.io/w/07c7f536"},"mutability":"MUTABLE","type":"LINK"},"2":{"data":{"href":"https://proglib.io/w/3e2497dc","url":"https://proglib.io/w/3e2497dc"},"mutability":"MUTABLE","type":"LINK"},"3":{"data":{"href":"https://proglib.io/w/3ed48045","url":"https://proglib.io/w/3ed48045"},"mutability":"MUTABLE","type":"LINK"},"4":{"data":{"href":"https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%A0%D0%B0%D0%B1%D0%B8%D0%BD%D0%B0_%E2%80%94_%D0%9A%D0%B0%D1%80%D0%BF%D0%B0","url":"https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%A0%D0%B0%D0%B1%D0%B8%D0%BD%D0%B0_%E2%80%94_%D0%9A%D0%B0%D1%80%D0%BF%D0%B0"},"mutability":"MUTABLE","type":"LINK"},"5":{"data":{"href":"https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%94%D0%B0%D0%BC%D0%B5%D1%80%D0%B0%D1%83_%E2%80%94_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0","url":"https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%94%D0%B0%D0%BC%D0%B5%D1%80%D0%B0%D1%83_%E2%80%94_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0"},"mutability":"MUTABLE","type":"LINK"},"6":{"data":{"href":"https://proglib.io/p/funkcii-v-python-5-zadach-dlya-trenirovki-args-kwargs-i-lambda-funkciy-2022-06-15","url":"https://proglib.io/p/funkcii-v-python-5-zadach-dlya-trenirovki-args-kwargs-i-lambda-funkciy-2022-06-15"},"mutability":"MUTABLE","type":"LINK"},"7":{"data":{"href":"https://proglib.io/p/competitive-algorithms","url":"https://proglib.io/p/competitive-algorithms"},"mutability":"MUTABLE","type":"LINK"},"8":{"data":{"href":"https://proglib.io/p/obrabotka-vlozhennyh-spiskov-i-matric-v-python-5-zadach-s-resheniyami-dlya-sovershenstvovaniya-navykov-2022-07-04","url":"https://proglib.io/p/obrabotka-vlozhennyh-spiskov-i-matric-v-python-5-zadach-s-resheniyami-dlya-sovershenstvovaniya-navykov-2022-07-04"},"mutability":"MUTABLE","type":"LINK"}}},"mentions":[]}