Поделиться

воскресенье, 24 марта 2013 г.

Редакторские будни: будьте милосердны к данным

Первая проблема всегда в задаче, а вторая - в данных. Мне ни разу не довелось встретить человека, который сказал бы: "Мне понятна задача, у меня есть все нужные данные, но я не знаю, что мне с ними делать"! Как правило, либо непонятен состав необходимых данных, либо то, где или как эти данные взять. Таким образом, ситуация, когда все нужные данные есть, но представлены они в непригодном для работы виде, комична и трагична одновременно.

Пример 1. Данные бухгалтерии

Я всегда считал, что в бухгалтерии... считают, считают все и много, а потому все эти объемистые массивы чисел, номеров статей и прочего должны по определению иметь форму представления, подходящую в первую очередь для машинной обработки. Как же я ошибался!

В прошлом году мне предоставили напечатанный на  160 страницах документ, шаблон которого приведен ниже. Я попросил электронный вариант, и он оправдал мои ожидания (вот уж действительно!) "чуть более, чем полностью". Я то как-то надеялся, что это просто какая-то хитрая выгрузка для печати была, но нет, на экране моему мгновенно ставшему испуганным взору открылся лист Excel с документом в той самой форме, которую я уже по достоинству оценил на "твердом" носителе.


Присмотримся:

  • Фильтр по исполнителю сделать нельзя - он ставится вместе с фильтром по заказчику, потому что умному Excel не может и в голову прийти, что две переменные могут размещаться в одной колонке. Только эти две переменные объединены таким образом -почему или зачем?
  • Ладно, ну не сделали отдельную колонку для номера извещения, но можно же было собрать все, что относится к одному извещению под одной строкой с его номером?! Но нет, одинаковые номера извещений встречаются по несколько раз.
  • На самом деле, все это было технично исправлено с использованием макросов. Настоящим испытанием стали ошибки и специфические приемы форматирования, наложившие отпечаток на данные. Плотность ошибок просто зашкаливала, что не позволяло нормально перегнать данные в Access, форматирование с помощью вставки в ячейки множества пробелов искривляло отчеты при печати. Правильная форма представления ("Заказчик", "Исполнитель" и "Реквизиты извещения" в отдельных колонках или еще лучше - "Заказчик", "Исполнитель", "Номер извещения", "Дата извещения", "Номер контракта" и "Дата контракта" в отдельных колонках), помимо прочего, позволила бы многих ошибок избежать - Excel предлагает вариант значения из уже заполненных ячеек в колонке после набора нескольких букв в пустой ячейке.
  • Вообще, смешивание всех реквизитов документа (и, как мы увидим дальше, не только) в одной ячейке - это одна из наиболее широко распространенных болезней, само существование которой, на мой взгляд, противоречит здравому смыслу. Если человек хоть как-то знает Excel и делопроизводство, то ему наверняка приходилось хотя бы раз сортировать данные по датам. Такая сортировка - это простейший вариант обработки, но в документе представленного формата выполнить ее корректно нельзя.
Пример 2. База данных по чрезвычайным ситуациям

Таблица Access, более 16 000 записей показанного ниже вида.


Снова присмотримся:
  • Если в предыдущем случае можно было решить многие проблемы с помощью простых макросов, то здесь без анализа предложений на естественном языке с разбиением на поля с важной информацией ничего сделать нельзя. Проще говоря, вообще нельзя сделать ничего! Да, все реквизиты документа в одном поле - это цветочки! Полное художественное описание опасности, чрезвычайной ситуации или угрозы таковой с цифрами и временем в одном поле типа MEMO - вот где высший пилотаж! В некоторых записях объем текста в этом поле превышает 2 600 знаков. Помнится, у меня тезисы были меньшего объема.
  • Никакой анализ этой чрезвычайно полной информации произвести нельзя, она представлена в виде для этого непригодном, ее можно только читать.
  • Людей из бухгалтерии оправдывает хотя бы то, что им нужно было ту информацию печатать с того же листа, в который они ее забивали, а здесь-то у разработчиков базы данных какая была мотивация (и, кстати, квалификация)?
Выводы:
  • Всегда держите данные в таком формате, который максимально удобен для машинной обработки. Особенно это касается больших массивов данных. Выделяйте общие классы и признаки отдельно, разделяйте дату и время, разделяйте реквизиты документа и т. д.
  • Помните, что сделать из документа в формате, удобном для обработки, документ, который красиво выглядит при печати, можно практически всегда. Превратить документ, который красиво выглядит, в набор данных для анализа часто нелегко, а иногда и просто невозможно. Поэтому первичной и наиболее важной формой представления данных является форма, пригодная для машинной обработки, а не отформатированный отчет в PDF с запретом копирования, с логотипом и рюшками.
  • Обратите внимание: грамотный выбор формы представления данных также позволяет избежать многих ошибок при вводе.

суббота, 2 марта 2013 г.

Редакторские будни: способы выделения терминов, важных слов и фрагментов текста

..журнал - тоже книга. - Чихольд Я.

По порядку:
  • Полужирное начертание - широко распространено, вполне допустимо, лучше подходит для заголовков. Крупный недостаток: выделенные таким образом слова или фрагменты текста бросаются в глаза сразу при взгляде на страницу, еще до того, как читатель дойдет до них "естественным" образом. Впрочем, этот недостаток может быть и достоинством в тех случаях, когда читатель просматривает материал в поисках определений. полужирное начертание любят использовать на доморощенных титулах ("Материалы для ежегодного государственного доклада..." и т. п.), хотя для этого нет оснований, более того, в широкоизвестном ГОСТ 7.32-2001 примеры титулов также приводятся без выделения полужирным каких-либо элементов.
  • Курсив (италик) - достаточно выделяет слова, но не бросается в глаза. Применяется для терминов. Слова и фразы на иностранных языках можно набирать курсивом без кавычек.
  • Подчеркивание - недопустимо, появилось от безысходности во времена печатных машинок, в явном виде запрещено к использованию в правилах оформления статей и тезисов для многих журналов и конференций. Кроме того, может создавать ложное впечатление гиперссылки (и обманывать ожидания), если речь идет об электронном документе.
  • Р а з р я д к а - аналогично предыдущему по трем первым пунктам. Сейчас она практически канула в Лету, но и до сих пор можно встретить многочисленные "И Н С Т Р У К Ц И И", "П Р И К А З Ы" и "п р и к а з ы в а ю:". Вообще, разнообразные документы наших государственных учреждений, в частности, приказы, настолько перегружены полужирным начертанием слов, разрядкой, словами, набранными заглавными буквами, линиями, как будто это не официальные документы, а рекламные проспекты, как будто исполнитель может отказаться от того, что там написано, и важно его завлечь. Вдобавок, присутствует непонятное по нынешним временам предубеждение против маркеров элементов перечней.
  • Полужирный курсив - применяется, если нужно выделить слово в полужирном наборе. Отдельно разумными людьми не применяется.
  • Обычное начертание, окруженное курсивом - применяется, если нужно выделить слово во фрагменте, набранном курсивом.
  • Капитель - в русскоязычных материалах применяется редко, хотя, мне кажется, что это довольно красивый способ выделения. При таком оформлении строчные буквы выглядят, как уменьшенные прописные, хотя, на самом деле, капитель для шрифтов разрабатывается отдельно и строчные капители имеют иные пропорции, чем заглавные буквы основного начертания шрифта. В западной типографике капитель применяется для выделения имен и названий. Выделение капителью больше двух-трех слов подряд ухудшает читаемость текста. Чтобы выделить капителью текст в html-документе, можно окружить его тегами <span style="font-variant: small-caps;">Текст</span> (атрибут внутри тега - это css-инструкция). В Word необходимо выделить текст и нажать Ctrl+Shift+K или установить флажок "малые прописные" в окне настроек шрифта.
Конечно, это все базовые рекомендации, основанные на моем опыте, вкусе и изучении мудреных источников. В реальности все не так просто - есть много нюансов. Например, та же самая разрядка может быть вполне оправдана при наборе прописными: заглавные буквы имеют другие размеры, нежели строчные, логично, что и промежуток между ними тоже должен иметь другой размер, он должен быть больше (то же касается капители). Но он однозначно не должен быть таким здоровенным, каким становится при втыкании между буквами стандартного пробела. Но это все - типографские тонкости, и к оформлению статей и научных книг они имеют мало отношения.

Если за выделяемым текстом следует знак препинания, его также стоит выделить. 

Особые виды оформления текста (это касается как отклонения от основного шрифта, так и разнообразных врезок, примечаний на полях - маргиналий и прочего) применяются либо в силу некоторого установленного протокола, когда в правилах оформления определенных материалов прямо сказано, что специфические по назначению или смыслу слова и фразы должны выделяться так, а не иначе, либо по желанию автора, который хочет акцентировать внимание читателя на чем-то важном с точки зрения первого. Во втором случае важно не перебарщивать с использованием особых видов оформления, в противном случае они "обесцениваются", уродуют зеркало набора (полосу, страницу с текстом) и делают чтение некомфортным. 

Игры и наблюдения 8

Dead Space 3. В целом понравилось, рискну даже заявить, что он лучше, чем первые два. Система крафта оружия доставляет, правда, только до той поры, пока не создашь пару агрегатов, каждый с парой калечащих инструментов, которые будут удобными, - после этого смысл создавать что-то еще теряется. Вероятно, мое понятие о том, какими видами оружия удобно нарезать врагов с учетом того, что живые и неживые виды оных часто чередуются, значительно расходится с представлениями разработчиков о том, какие виды оружия должны быть достаточно мощными, чтобы можно было использовать их эффективно, поэтому даже на уровне сложности Normal с максимальными апгрейдами, каковые удалось найти, абсолютное умершвление и разбор противников на составляющие происходили отнюдь не с первого и иногда не со второго раза. Впрочем, в этом игру винить нельзя. В чем ее можно винить, так это в дезинформации посредством звука. Одни из самых неприятных в игре некроморфов - это... я даже не знаю... смертники с бомбой, которые довольно шустро подползают и взрываются, нанося значительный урон. Они были и в предыдущих сериях, и каждое их появление сопровождалось криком довольно-таки высокой частоты и омерзительности, доносившимся со стороны их приближения. В третьей части этот звук доносится... отовсюду, такое ощущение, что разрабы забыли его привязать к геометрии, поэтому как только слышишь что-то подобное, приходится крутиться на все 360 градусов, чтобы понять, откуда исходит угроза подрыва, а других угроз (быть оцарапанным, оплеванным, укушенным или заваленным на землю) при этом никто не отменяет.

Metal Gear Rising: Revengeance удивительно приятна. PlatinumGames реально умеет делать забавные механики боевки. Если Vanquish был приятен и ни о чем, то Revengeance, как бы, еще и часть вселенной Metal Gear. Для фанатов Снейка это, конечно, не шедевр (ни по механике, ни по сюжету), но никто и не обещал 5-ю часть саги. Если принять к сведению, как, сколько, почему и какой игрой разрабатывался Revengeance, то он получился очень и очень даже неплохим: есть знакомые персонажи, ссылки на известные корифеям события и термины и т. д. Получился эдакий недолгий, но приятный визит в знакомый мир спустя много лет и в другом жанре. Боссы красивы и забавны, Рейден крут. Непонятно только, почему нельзя было сделать Moves List, хотя бы для покупаемых приемов (или я его не нашел?).

Sly Cooper: Thieves in Time - это вообще бальзам на раны. Поскольку разрабатывала игру студия Sanzaru Games Inc., ранее известная мне лишь по HD-переделкам и PSP-играм, а не Sucker Punch - создатели оригинала, было очень серьезное опасение, что игра будет так себе. Но ребята молодцы, причем во всех отношениях:
  • они не стали увлекаться размножением доступных персонажей, которое напрочь испортило третью серию, однако
  • в каждом эпизоде есть уникальный для него персонаж с уникальными же способностями;
  • геймплей классически видоизменяется от миссии к миссии, и это не дает заскучать;
  • разработчики вернули в игру бутылки и сейфы;
  • вообще, они взяли за основу вторую игру серии - лучшую, на мой взгляд, а не первую или третью.
Естественно, есть недостатки, и главный из них - непонятно зачем нужная бледная карта. Я не понимаю, почему нельзя нанести на нее сейф, который я уже видел и пытался вскрыть, сокровища, которые я уже пытался утянуть, но не преуспел, ключевые места и переходы в другие зоны. Ребята, у меня топографический кретинизм: я нахожу сейф и, если не могу его вскрыть, в следующий раз снова его ищу столь же долго, как и в первый. Нафиг нужна карта всей зоны, если единственное, что на ней есть - это враги? Почему меня должно интересовать, какой кабан с фонарем (один из видов стражников) бродит где-то на другом конце города? А враги поблизости и так видны на радаре. Фактически, карта настолько бесполезна, что это признали даже сами разработчики или какие-то другие люди, которые определяли состав трофеев - иначе зачем они ввели трофей "Посмотрите на все карты во всех эпизодах"? То есть для игры, которая заточена на исследование местности (!), имеющаяся карта настолько не нужна, что вас награждают за то, что вы ею пользуетесь. Умора! Ну а в целом игра прекрасна, на пять с минусом (минус, естественно, за карту - это ж надо проделать такую гигантскую работу, с любовью, с талантом и лохануться на такой легко реализуемой мелочи, по совместительству являющейся базовой для такого типа игр).