Распределённые блочные хранилища (ликбез)

В ходе возни с кластером на работе, решил посмотреть существующие распределённые блочные хранилища. Что вообще за хрень такая, в каком оно состоянии и возможные подводные камни.

→ Читать дальше...

Новый проект -- libsimdb, библиотека для поиска визуально похожих изображений

Эта идея периодически всплывала в голове, поскольку минимум раз в год я перебираю свой архив контента. Но, поскольку это именно что "раз в год", реализация неоднократно откладывалась.

→ Читать дальше...

2017-02-08

Почтовый шлюз: задание со звёздочкой (Донастройка антиспама на примере конкретных писем)

И в завершение хочу показать несколько примеров писем, и разбор "на что смотреть" и "как ловить". Из заголовков ничего не удалял, оно конечно несколько раздувает примеры, зато даёт реальное представление о типовом письме.

→ Читать дальше...

Почтовый шлюз: задание со звёздочкой (Базовая настройка rspamd)

Первое о чём хочу сказать - софт достаточно "молодой", года полтора, поэтому в каждой версии ломается нещадно, даже в микро-версиях (например 1.0.3 -> 1.0.4). Второе - правила по-умолчанию тоже достаточно "сырые". Могут быть и false-positive, и неадекватные score. Пример - дефолтные 15 баллов могут набрать только совсем лопоухие.

В отличие от spamassassin'а здесь не придают такого значения регекспам, анализ текста достаточно слабый. Например нет простейшего обнаружения смешанных букв в словах. Хотя посмотреть на расширение прикреплённого файла - это пожалуйста.

Также в проекте практически отсутствует актуальная документация. Хотите разобраться - готовьтесь смотреть исходники.

Это очень большая тема, на самом деле, поэтому я приведу лишь те моменты, без настройки которых оно совсем уж днище.

→ Читать дальше...

Почтовый шлюз: задание со звёздочкой (Обратная связь и переобучение системы)

Антиспам - это конечно хорошо, но это всего лишь тупой робот с набором правил. Ошибки в настройке случаются и у наших корреспондентов.

Типовая ситуация: юзеру лень писать тему в письме из 2х pdf'ок. Антиспам про лень юзера ничего не знает и видя отсутствие Subject'а - задирает ему итоговый балл.

Ещё пример: секретарша Марина херачит рассылку на всех 200 клиентов компании одним письмом. Может ей домой побыстрее надо, или курить - не важно, получается письмо с 200 адресами. Антиспам опять отреагирует в меру своего разумения: задерёт балл такому письму.

→ Читать дальше...

2016-04-20