Archive for Высокие технологии

Интересная идея для стартапа: геоинформационные технологии.

В университете на дипломной работе, я занимался тем, что делал некий аналог интернет карт. Самое интересное было – это работа с картографической информацией. Когда карты в сети стали более распространены, я обрадовался, т.к. можно делать весьма и весьма интересные вещи. Провозившись некоторое время с API Yandex.Maps, я понял, что инструмент есть, но надо много данных собрать.

Техническая часть идеи.
Яндекс.Карты позволяют наносить поверх карт точки, линии, полигоны. Рассчитывать где рисовать полигоны, линии и точки поможет PostGis для PostgreSQL. Осваивается PostGis достаточно легко. По крайней мере, для первого результата, достаточно бегло прочитать мануал.

Необходимая информация.
Что бы провести какие-либо вычисления в PostGis, необходимо иметь базу объектов с их координатами. На дипломной работе мы брали демо-версии карт MapInfo, парсили их и наполняли базу. Яндекс.Карты поддерживают геокодирование (и обратное тоже), но к сожалению получить просто так базу объектов города не получится. К тому же важна не только информация о координатах объектов, но и описание этих объектов. Небольшой нюанс, объекты это не только строения, но и дороги, поля, леса и т.д. Разная информация есть на разных ресурсах. Те же самые Яндекс.Карты, Мапия, порталы с недвижимостью.

Пару идей.
1) Для недвижимости это может быть оценка привлекательности жилья. Необходимо составить базу «положительных» объектов (магазины, школы, садики, больницы, транспортные развязки, парки) и «отрицательных объектов» (заводы, фабрики, стройки, оживленные трассы, отстойники и т.д.). Построив полигоны влияния «положительных» и «отрицательных» объектов, рассчитав пересечения этих полигонов и степень их влияния, можно вывести некоторую оценки привлекательности жилья.
2) Для бизнеса будет интересно проведение анализа с помощью диаграммы Вороного, а так же ее разновидности. Несколько лет назад слышал такой кейс. Клиент заказал у одной ГИСовской компании провести анализ. У клиента было несколько магазинов по городу. В каждом магазине можно было купить некий продукт. Построив диаграмму Вороного, видно, где лучше поставить еще магазин и куда надо завозить продукции больше.
3) Некий социальный проект, который подходит скорее правительственным структурам, чем бизнесу. Создание карты с экологической информацией.
4) Шуточная идея. Ставите точку где-то в городе. Задаете коэффициент увеличения. Т.е. точка каждую итерацию растет на 1км. Делается это по средствам построение буфера. Разрисовывая каждую новую итерацию можно получить интересную картинку. Потом можно баловаться двумя вещами: метод наращивания площади и скорость.

Почта для домена – это удобно

Почта для доменаДавно уже Яндекс запустил сервис «почта для домена». До этого я тоже слышал о таких сервисах, но пользоваться как-то не приходилось. Совсем недавно решил посмотреть, что же это такое. Причина банальная: сервер администрирую не я, а потому сделать почтовый ящик сразу не получается. А очень захотелось. Так появился «me [как-то-так] gudkovsa.net».

Подключение происходит всего за пару-тройку минут. За 10 минут я подключил и проверил работу почты, а так же и интерфейс настроил. Посмотреть Яндексовскую почту для домена можно тут.

После нескольких дней использования, на «почту для домена» переехали и другие проекты. Буду рекомендовать клиентам, которые держат ящики у хостеров.

Преимущества:

  • больше не надо возиться с почтой на сервере, веб-интерфейсы идут лесом, настройка антиспама и т.д. Все в сад. И прошу! Не надо говорить, что хорошие админы настраивают один раз и там нет ничего сложно. Ибо разница между «сделать несложное» и «ничего не делать» весьма существенна.
  • полное администрирование ящика: админ больше не нужен.
  • если Ваш сервер упадет, то почту Вы все равно получите.
  • хорошо работает спам-фильтр.
  • мобильная версия. Я таким не пользуюсь, но для кого-то это определенно плюс.

Сегменты пользователей и отслеживание событий в Google Analytics

На всех сайтах, в проектах которых я принимаю участие, установлена система статистики Google Analytics. Достаточно долго хватало того, чтобы просто смотреть откуда пришли пользователи, что делали на сайте и какова вообще посещаемость. Недавно, для одного ресурса этого перестало хватать.
В сети, почитывая разные блоги и ресурсы, я узнал, что у Google Analytics есть две великолепные штуки: сегменты пользователей и отслеживание событий. Тем, что было сделано, я и хочу поделиться.

Отслеживание событий.

Очень удобный и полезный инструмент. Основное его преимущество, я вижу, в том, что события – это не только посещение страниц, а и события на странице и события на сервере.
Немного об отслеживании событий на страницах. Сам код отслеживания событий представляет собой вызов одной функции на JavaScript. Потому мы можем ставить такие события на отправку формы, на клик по ссылке, на клик по картинке и всякие другие события, которые есть в JavaScript.
С отслеживанием событий на серверной части немного хуже. Точнее его вообще нет. Но есть великолепный выход. В серверной части сайта, когда происходит то или иное событие (например, пользователь залогинился, пользователь зарегистрировался), то сайт фиксирует это событие, и отдает браузеру html со встроенным вызовом функции трекера. Т.е. как только пользователь загружает эту страницу вызывается функция трекера и событие засчитывается. Мне это очень помогает, потому что часть сайта функционирует через AJAX, и некоторые действия пользователей не приводят их на отдельные URL’ы. Зато, через AJAX я могу вызывать функцию отслеживания событий.
Вы можете сами придумывать события и генерировать их. Все события имеют такую иерархию: Категория события – Название события – Метка – Значение метки. По крайней мере я это так понимаю. Сразу же я выделил три категории событий:
- UserActions – действия пользователей, например «LoggedIn», «LogOut», «WriteComment» и т.д.
- UserClicks – разные события на отправки форм и клики на разные блоки сайта
- System – всякие системные значения.
Больше всего мне в этом нравится то, что на основе этого можно провести сравнительный анализ дизайна сайта. 50%-ам пользователей показывать один блок, другим 50% другой блок на одном и том же месте, или ссылки назвать по-разному. И просто замерять на какой из них больше кликать будут. Занятно должно получиться.

Сегменты пользователей.

Очень удобно для просмотра неких срезов в посещаемости.
Первым моим шагом было создание базового сегмента пользователей на основе географии. Т.к. ресурс посещают люди из разных стран, а меня интересует только некий регион (там можно и набор регионов делать).
Далее пошло размножение этого сегмента. Сама функциональность создания копии сегмента очень обрадовала, т.к. руками создавать каждый сегмент относительно небыстро и достаточно нудно/скучно.
Скопировав базовый сегмент, я добавил в него переходы из поисковых систем. Особая радость заключается в том, что там можно вносить регулярные выражения на ключевые слова. Это меня радует т.к. ресурс собирает и относительно нецелевой трафик из поисковиков по низкочастотным запросам. Выделив семантическое ядро и включив его в сегмент пользователей, я получил срез аудитории, которая приходит только из поисковиков и только по ключевым фразам.
Далее сделав выборку этого сегмента можно смотреть, какие страницы они посещали, какие действия делали, показатель отказов и т.д. По секрету скажу, что этот срез аудитории меньше всего конвертируется на сайте. А до такого маленького исследования, я думал совсем иначе.
На двух таких сегментах я не остановился. В третий сегмент я включил пользователей, которые выполняют определенные действия (на основе отслеживания событий). Результат получился тоже весьма интересный. Оказывается самые конвертируемые пользователи – это прямые заходы на сайт, без сайтов источников.
На последок, я решил создать некий сегмент, который бы объединял региональную выборку, выборку по поисковым запросам и по действиям пользователей. Этот сегмент стал таким глобальным сегментом целевой аудитории. Оказалось ее не так уж и мало, как могло быть, но и не так много как хотелось бы.
Главный вывод, который я сделал из этого всего, заключается в том, что большинство решений стали более обоснованными и многие мифические суждения развеялись.

Поисковые машины – а чего бы хотелось?

Поисковые системы сегодня известны всем. Многие неопытные пользователи считают, что поисковые системы и есть Интернет, потому что вход в сеть начинается через них. Недавно передо мной возникла задача поиска весьма интересной информации. Проблема заключалась в том, что я точно не знал, что я ищу. Об этом дальше.

Сегодня поисковики построены таким образом, что стараются ответить на поставленный пользователем вопрос. Например, «кто первый полетел в космос?». Это вполне конкретный вопрос, на который есть вполне конкретный ответ. Я считаю, что для такого запроса сегодня и существуют поисковики. Поисковые машины удачно решают задачи с покупкой мобильного или ноутбука, поиск какой-то конторы для подряда. Можно даже рецепты блюд найти. Главное знать, что искать. Думаю это основное.

Но что делать, если я не знаю, что я конкретно ищу. У меня такая проблема возникла при поиске информации для изучения темы управления проектами. «Базовой информации» в сети достаточно. Достаточно прочитать пару тройку книг и пару лет опыта, что бы большая часть этой информации стала не совсем интересна. В принципе, я уверен, что по многим темам «базовой информации» навалом, но как из этой информации выделить ту, которая обладает ценностью.

Под ценностью информации, я понимаю краткость и четкость изложения материала. К сожалению по моей тематике я нашел лишь множество дублей, которые описывали на несколько листов то, что в вики описано в нескольких предложениях.

Выходом мне видеться создание некой поисковой машины, которая бы удовлетворила такого рода запросы. Описывать, как ее создавать и делать намеки на алгоритмы, я не хочу, т.к. в алгоритмах поиска практически не разбираюсь. Расскажу, что бы я хотел от такого поисковика.

Во-первых хочу, что бы поисковик по запросу определял различные суб-тематики. Например если я ищу «управление проектами», то это «тренинги», «услуги», «теория и практика».

Во-вторых хочу, что бы поисковик умел фильтровать эти суб-тематики. Только это не стоп-слова, а именно фильтрация тематик. Ибо «тренинги» и «обучение» – это одно и тоже, если я ищу «услуги».

В-третьих хочу, что бы поисковик определял тематику страницы в «широком» понимании. Например, на странице может быть не указано ключевое слово «вязание», но вся страницы может быть исписана описанием крючков. Это наверное одно из самых главных «хочу», т.к. именно это позволяет расширить область знания, добраться до знаний о которых мы не знаем. Или хотя бы натолкнуться на вопросы, которые позволят нам искать дальше.

Жаль, что коммерческое использование такой машины затруднено, на мой взгляд. Но наверняка такая поисковая машина пользовалась бы популярностью в ученых кругах.