Almost everyone has heard of D3, but what about the others?

Graphics and visualization developers often get presented with a simple yet difficult question: “Which visualization library should I use?”

Typically, making this decision is not about whether one library is “better” than another, but whether the specific library is more suitable for what the developer is trying to achieve.

To answer this question thoroughly, we need to start by better understanding the actual design space of visualization libraries. Based on a survey of web-based libraries (i.e. javascript packages), we could conceivably map out a landscape based on two attributes:

  • Level of Abstractionwhich maps roughly to two aspects: The first is the effort required from the developers to create a visualization. Higher-level libraries usually require fewer lines of code and/or fewer concepts to learn compared to lower-level libraries. Another is expressivity, or how much you can customize, which is in the opposite direction. Higher-level libraries will not let you customize much while you can have a lot more freedom and flexibility with lower-level libraries. …

Image for post
Image for post

คุณอาจเคยอ่านเรื่องการสัมภาษณ์งานที่บริษัทเทคโนโลยียักษ์ใหญ่ทั้งหลาย เช่น Google, Facebook, ฯลฯ ไม่ว่าจะเป็น software engineer, data scientist, หรือตำแหน่งอื่นๆ การสัมภาษณ์เป็นบททดสอบแรกที่สำคัญมาก แต่นั่นก็เป็นเพียงแค่จุดเริ่มต้นของการเดินทางเท่านั้น

เคยสงสัยไหมว่าเข้าไปได้แล้วยังไงต่อล่ะ? จ้างมาแล้วบริษัทคาดหวังอะไรจากเรา? ส่วนตัวพนักงานเอง ถึงแม้จะได้ทำงานที่เคยฝันไว้ แต่ถ้าทำไปสักพักแล้วไม่รู้สึกถึงความก้าวหน้าอะไรเลย พนักงานก็หมดไฟได้เหมือนกัน

เมื่อบริษัทจ้างคนเข้ามาจำนวนมาก ก็จำเป็นต้องมีระบบการประเมินผลเพื่อรักษามาตรฐาน และกำหนดแนวทางเกี่ยวกับการเติบโตที่ชัดเจนเพื่อผลักดันให้พนักงานพัฒนาตัวเองขึ้นไปเรื่อยๆ และเห็นภาพในระยะยาวว่าตัวเองจะมีความก้าวหน้าในหน้าที่การงานได้อย่างไรหากอยู่กับองค์กรต่อไป ความก้าวหน้าที่พนักงานรู้สึกจับต้องได้มากที่สุดอย่างหนึ่งก็คือได้เลื่อนขั้นนั่นเอง บริษัททั้งหลายจึงออกแบบ “ขั้นบันได” หรือที่เรียกกันว่า Career Ladder เพื่อกำหนดเป้าหมายให้ชัดเจนว่ามีขั้นอะไรบ้าง พร้อมระบุความคาดหวังของแต่ละขั้นให้ชัดเจน…

Preparing for data visualization job interviews can be quite challenging, as it seems every company asks different things. I wrote this article based on my own experience, hoping it can give job hunters some ideas on what to expect, as well as surveying ideas for conducting an interview for someone with this skill set.

Image for post
Image for post


About a year ago, I had the opportunity to interview with several tech companies in the San Francisco Bay Area for roles related to data visualization.

The reason I use the term “roles related to data visualization” is because not every job listing includes “data visualization” in the name. (On the other hand, some job listings that have “data visualization” in the names or description may not include that much visualization work.) There is data visualization work in engineering, data science, journalism, research, design, consulting, etc. Your day-to-day could look very different, with varying amounts of data visualization work. For example, some roles expect you to create visualizations using Tableau much of the time. Other roles consider data visualization a nice-to-have skill, but is not mandatory for doing the work. Some roles expect you to implement their in-house systems with custom data visualizations as part of them. Some roles expect you to focus on the design and let others implement, i.e. code, interactive data visualization for you. …

หลายๆคนอาจได้ลองเล่น simulator จัดตั้งรัฐบาล 🗳 จาก ไม่ว่าจะมาจาก ELECT Live ระหว่างติดตามผลการเลือกตั้งสดๆ หรือเห็นตามลิงค์ที่แชร์กันในโซเชียลมีเดีย

Image for post
Image for post
“ทำนายผลเลือกตั้ง 2562”

สิ่งที่คนส่วนใหญ่อาจไม่รู้คือการทำงานแบบนี้ชิ้นหนึ่งออกมา มันมีรายละเอียดและความใส่ใจที่ทีมงานได้ใส่ลงไปมากมาย 🤯 ปรับแล้วปรับอีกกว่าจะออกมาเป็นแบบที่ทุกคนเห็น ดังนั้นบทความนี้ก็จะมาเล่าให้ฟังว่ากว่าจะออกมาเป็นเวอร์ชั่นปัจจุบันนั้น เกิดอะไรขึ้นหลังฉากบ้าง

There is data science and there is boba science

Image for post
Image for post
Photo: d3sign/Moment/Getty Images; all other images: Krist Wongsuphasawat

Have you ever felt frustrated when you finish all the tea in your bubble tea before the bobas (tapioca balls)? I am pretty sure you are not alone.

One strategy is to maximize boba consumption in every sip, i.e., try to get the maximum amount of bobas while getting the minimum amount of tea possible. But what exactly are the maximum and minimum amounts?

Edward Tufte is a famous author of visualization books series. He also teaches a well-known one-day class on visualization, which I took back in 2007 when he was in DC. I enjoy his books and still have them on my shelf. He knows a lot and is right about many concepts in information visualization: Sparklines, for example.

Image for post
Image for post
A snippet from Tufte’s book “Beautiful Evidence” discussing Sparklines

However, one controversy in his teachings is the case against PowerPoint. He once wrote a pamphlet called “The Cognitive Style of PowerPoint” and includes an entire session about why PowerPoint is evil in his one-day class. …

Over the past few months, I came across a few PhD students who encountered ongoing projects in the industry and asked,

“This problem has been solved. Why is XXX reinventing the wheel?”

A few years ago, I would have had similar thoughts. After working for a while in the industry where I no longer do pure research, my perspective has changed.

What is “solved”?

The definition of “solved problem” in academia is different from the industry. Solutions in academic publications usually work well under a few assumptions. These assumptions were carefully chosen to make sure the scope covers the common cases while avoiding the rare edge cases (a.k.a. leaving them for future work). Roughly we can say that it works for 90% of the time. The publication systems also give little incentive for researchers to work on the remaining 10%. Oftentimes, paper submissions are rejected due to “incremental” contributions. Also, one of the PhD students’ worst nightmares is learning that somebody just publish something close to their dear dissertation topic. …

“เห็นคนนั้นก็ Big Data คนนี้ก็ Big Data แล้ว Data ของฉันมัน Big กะเขาบ้างหรือยัง?”

Image for post
Image for post

พอพูดถึง Big Data หลายๆคนก็คงจะนึกถึงปัจจัยสามอย่าง (3V) ที่ถูกสอนตามๆกันมาว่านี่แหละ ที่ทำให้ข้อมูลมันบิ๊กนัก

  1. Volume ปริมาณข้อมูลที่ต้องเก็บ เช่น อยากรู้ว่าคนเข้ามาดูเว็บเราทำอะไรบ้าง จึงเก็บบันทึกกิจกรรมที่ผู้ใช้แต่ละคนทำไว้หมด ยิ่งเก็บละเอียดมากเราก็มีข้อมูลไปวิเคราะห์มาก แต่ก็กินที่เก็บมากขึ้น แล้วจะเก็บข้อมูลย้อนหลังกี่วัน ถ้าเก็บไม่กี่วันทิ้งบ่อยๆก็ไม่ใหญ่เท่าไหร่ ถ้าเก็บนานก็กินที่เยอะหน่อย
  2. Variety ความหลากหลาย เช่น นอกจากตัวหนังสือล้วนๆแล้ว อาจจะมีรูปภาพ วีดีโอ เสียง ฯลฯ
  3. Velocity ความถี่ในการเก็บข้อมูล เช่น พวกข้อมูล sensor จากดาวเทียมที่ส่งมารัวๆก็ทำให้เก็บข้อมูลแป๊บเดียวก็ใหญ่มาก

แล้ว V เท่าไหร่ถึงจะบิ๊กล่ะ? เออ นั่นสินะ… 🤔

Big Data ที่เขาว่ากัน…

ในทางปฏิบัติ Big Data มักหมายถึงข้อมูลที่ใหญ่จนจำเป็น (ขอย้ำว่าจำเป็น) ต้องใช้เทคโนโลยีที่ออกแบบมาพิเศษเพื่อการประมวลผลข้อมูลขนาดใหญ่ (เช่น MapReduce) ตัวซอฟท์แวร์ยอดฮิตที่ใช้กันแพร่หลายก็คือ Apache Hadoop หลังๆมานี้ก็มี Apache Spark อีกตัว

ซึ่ง Hadoop หรือ Spark นั้นทำอะไรได้น้อยกว่าบรรดา พวกเทคโนโลยีดั้งเดิม (สำหรับ “small data”) แต่มีจุดแข็งอยู่ข้อเดียวคือจัดการกับข้อมูลได้ปริมาณเยอะกว่า (เน้นถึกครับ 🐃) ถ้ามีทางเลือกอื่น…


Krist Wongsuphasawat

Data Experience @airbnb / Prev: Turn data into pixels @twitter • Invent new vis @UofMaryland HCIL PhD • From @Thailand •

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store