Просто о программировании

Машинное обучение 5. Математическое ожидание. Дисперсия.

Допустим мы жмем на кнопку и компьютер выдает нам случайное число от 1 до 10. Причем вероятность появления разных чисел разная. Возьмем и умножим каждое число на его вероятность, а потом сложим все такие суммы для всех чисел. В итоге мы получим среднее арифметическое, как если бы у нас выдало 1000 чисел, мы бы их сложили и разделили на 1000. Это называется "математическое ожидание". Вот график из прошлой статьи, где по оси x идет рост, а по y - вероятность того что этот рост встретится у людей, если мы возьмем 1000 человек...

4 месяца назад

Блокчейн 3. Безопасность данных.

Мало просто описать кто чем владеет. Надо еще сделать все это безопасным, чтоб кто угодно не мог менять владельцев у вещей как сам захочет. И на самом деле тут не придумано ничего кардинально нового. Обычный вход в свой аккаунт по логину, паролю и прочим подобным штукам. Но вот проблема... Вошел я в свой аккаунт, создал транзакцию, просто в виде текста, и разослал ее по всему миру, чтоб сообщить всем что я сделал что то со своими вещами. Но когда он будет ходить где то там по интернету, как другие...

4 месяца назад

Блокчейн 2. Право владения.

Как описать в программе, то, что какой то человек чем то владеет? Есть два способа. 1) Взять все вещи которыми может кто то владеть, и прописать для каждой из них владельца. Если владелец изменился, то мы меняем владельца на другого. 2) Составить отчет в котором будут указаны все случаи когда у вещей менялся владелец, и потом просматривая эту хронологию с начала до конца, понять к чему в итоге мы пришли. И в блокчейне используется именно второй способ. Он лучше подходит потому что в блокчейне нет...

4 месяца назад

Блокчейн 1. Введение.

Допустим у нас есть компьютеры или программы объединенные в так называемую пиринговую сеть, то есть все отдельные участники сети равны между собой, нет каких то главных участников и подчиненных им, каждый участник сети может напрямую общаться с любым другим участником, делиться со всеми любой информацией. При этом никто не контролирует участников, они могут делать все что захотят. И вот мы хотим в такой системе сделать что то серьезное, ответственное, например систему для обмена деньгами между собой...

4 месяца назад

Машинное обучение 4. Плотность вероятности.

В прошлой статье мы вычисляли вероятность каких то событий, и этих событий было конкретное ограниченное количество: либо выпадает орел, либо решка. Но бывает и другая ситуация, например мы берем тысячу разных случайных людей и замеряем их рост. Рост может быть любым вещественным числом, например 156.0 см или 175.233453 см. Нарисуем такой график. Тут по оси x идет рост людей, а по оси y вероятность того что такой рост встретится у людей. При этом вместо слова "вероятность" тут используют выражение "плотность вероятности"...

5 месяцев назад

Машинное обучение 3. Вероятность. Условная вероятность. Формула Байеса.

Когда мы в машинном обучении решаем задачи типа распознавания чисел на картинках, мы на самом деле не можем точно сказать что вот на этой картинке нарисовано именно это число. Мы можем только предположить, что да, это вроде похоже на то что нам нужно, а вон то ну как то совсем не похоже. Чтоб работать с такими предположениями, когда мы не знаем точной истины и можем только догадываться, нам нужна теория вероятностей. Давайте разберем некоторые основные вещи из нее. Допустим мы проводим «испытание»: подбрасываем монетку два раза и смотрим что там выпадет...

5 месяцев назад

Репост

5 месяцев назад

Машинное обучение 2. Аппроксимируем линию.

Регрессия это когда мы говорим программе что для вот таких то конкретных входных данных результаты будут вот такие, а потом мы даем ей входные данные, результат которых программа не знает, и она должна сама догадаться, какой должен быть результат. Допустим мы измеряем температуру в течении года и рисуем ее на графике. Измерение проводится первого числа каждого месяца. Получится несколько точек на графике. Но что если имея эти точки нам надо определить, например какая была температура в середине каждого месяца? Ведь точек на графике в этих местах нет...

5 месяцев назад

Машинное обучение. 1. Введение.

Люди часто решают задачи где надо найти обобщенные шаблоны, закономерности. Например разделить вещи по группам или понять что объединяет две разные вещи. И когда появились компьютеры, люди задумались - а нельзя ли решать такие задачи автоматически, с помощью компьютера. В результате появилось то что мы называем "машинное обучение". Возьмем такой пример: у нас есть картинки на которых нарисованы разные цифры, написанные от руки, разными почерками. Размер картинки 20 на 20 пикселей, и для каждого...

5 месяцев назад

О-нотация. Скорость работы алгоритмов.

Среди всех алгоритмов часто встречаются такие, которые что то делают с данными. И если входных данных много, то нам конечно же хочется чтоб он работал побыстрее. Но как измерить с какой скоростью выполняется алгоритм? Замерить время в секундах? Но ведь входных данных может быть разное количество, да и на разных компьютерах время будет разное. Посчитать сколько действий мы делаем во время работы алгоритма? Но ведь у него могут быть разные реализации, он может быть написан на разных языках программирования, а возможно у него вообще не будет реализации и он просто описан на словах...

5 месяцев назад

Поиск в тексте. Часть 3.

По сравнению с простым поиском отдельных слов, регулярные выражения конечно выглядят очень мощными, может показаться что теперь то уж с ними можно найти все что угодно. Но на деле все еще остается много задач где не справляются даже регулярные выражения. Например вот, наверно самый популярный пример: есть текст вроде "абв(гдеёж(зийк)л(мн)опр)стуфх". Тут внутри скобок написан текст и еще другие вложенные пары скобок. Нам нужно взять самую первую открывающую скобку, взять соответствующую ей закрывающую скобку и найти весь текст внутри этих скобок...

5 месяцев назад

Поиск в тексте. Часть 2.

Прошлая статья была о том как найти в тексте конкретный набор символов. Но что если надо найти в тексте все номера телефонов, или все слова на букву "а"? Тут простой поиск уже не подойдет, уже даже потому, что мы сами конкретно не знаем какие именно символы надо найти. И тут в дело вступает поиск по какому то шаблону, например чтоб найти номер телефона, надо найти такой набор символов где подряд идут 11 цифр, а по краям стоят пробелы. Но как это записывается? Что мы должны написать в строке поиска?...

5 месяцев назад