互联网技术 / 互联网资讯 · 2023年12月18日

如何成为一个故事大王的数据科学家?

作为数据科学家,我们也应擅长讲故事。我们经常要向不同的利益相关者展示工作,由于他们的背景不同,所以我们也要相应地变化语调。但在任何情况下保持不变的是,讲故事的那个人是你。

许多方法有助于讲好故事,让我们一起来研究研究。

尽可能多地交流

交流是有效实现某事的关键。作为数据科学家,尽可能多地与不同的相关者交流就更加重要。我们通常把相关者分为四类:

用户—他们渴望看见经验的最佳解决方法 领域专家—他们有义务用领域的专业知识提供帮助 行政领导—他们对业务和收入更感兴趣 技术人员—他们对技术方面的事最感兴趣

为了有效地与他们交流,需要用他们能理解的方式交谈。用户对于最终解决方案和解决难题的方法更感兴趣;行政领导和经理更倾向于关注收入及相关的事情;领域专家乐于在相关领域用专业知识提供帮助。你需要利用他们的知识为给定的问题构建一个好的解决方案。

以既定事实开头

讲故事要以人们都知道的事实开头。可以是用户每天面对的问题,或是未经优化的、可以智能化的东西,也或许是能为公司创收的东西。若以人们早就知道的事开头,人们就能有更好的理解,因为他们亲身经历过这件事。

通常,对于不直接接触技术的概念的人来说,技术概念抽象模糊又复杂。讲故事包括两部分:

有助支撑论据、易于观众理解后面的故事情节的种种事实。 为了说服观众采取行动、把故事中展示的事与思考内容和思考方式联系起来的叙述

因此,有必要以一种为预期的相关者描绘解决方案的方式来展示事实。

利用视觉化吸引观众

一图值千言。的确如此,仅仅一张图就能展示你想向观众传达的一大堆话。不同的图表、数字、视觉化工具可供选择以让观众更好地理解数据进展、数据趋势以及数据的一般行为。

有时在分析数据或使用不同的统计技术时,可能会遗漏有用信息,此时教具和图表会起作用。它们使你发现之前未注意到的部分、方面以及对加强数据的理解。

视觉化实际上是一个机会,让你用观众理解的事替代故事。例如,如果在一个图表里有许多变量,那么观众可能不易理解,在图表也复杂的情况下。所以,你最好制作简单而直接的视觉图像以便利用它们叙述故事。

使用统计学理解数据

统计学对于理解和解释数据大有裨益。你可以从中推断出许多事实,并利用这些事实来更好地理解它们。

统计学主要可以分为两类,描述统计学和推论统计学。前者描述现有数据而后者展示数据中不同特点和变量的总体关系。通常,使用描述统计学能获得关于当前或可用的一组数据的信息,而使用推理统计不仅仅能基于一个或多个样本使用抽样来概括总体。

根据故事的不同层面选择不同的统计学类型很重要,这可以对现成的数据加以解释,并把结论讲给那些你不了解他们的特点的人。你可以使用这一信息告诉观众你在数据中发现的不同的理解,并相应地建立不同的假说。

解释模型的运作原理

机器学习模型通常被称为“黑盒&Rdquo;。如果你使用过一些高级模型,那么就需要在性能和可解释性之间进行权衡。线性模型,逻辑回归模型和基于树的模型是容易解释的,而非线性模型是很难解释的。

在现实世界,没人想使用自己不理解的东西。而且,在一些领域如银行业、保险业和药业,更需要解释管理过程要求。可解释性的另一层面是对不同利益相关者的终极信任。众人皆知,如果我们清楚地理解一件事的运作原理,那么就会自信地使用它、信任它。

同理,机器学习模型也是如此。如果理解这些技术,人们就会对题目更感兴趣。可解释机器学习模型的技术多种多样。一些现有的技术与统计推断相关,它们可以帮助我们识别关键特征,并从数据中获得有意义的表示。

讲故事涉及多种内容。它是一种艺术,通过实践和学习可以加强讲故事的能力。它可以从原始数据中挖掘出黄金,帮助你和你的用户发现之前可能会遗漏的理解和信息。

希望本文的技巧能帮你修炼成为一个“讲故事大家&Rdquo;。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册