Os dados são um tópico delicado e, naturalmente, você estará envolvido em muitos deles como cientista de dados. Aqui estão algumas regras que você deve sempre seguir.

Os dados são extremamente valiosos e aproveitá-los é facilmente uma das práticas recomendadas para a maioria das organizações atualmente. Mas conhecer os padrões do setor em relação a isso é necessário para que os cientistas de dados não errem com os dados à medida que as pessoas aprendem mais sobre seu valor.

Como tal, os cientistas de dados devem adotar práticas seguras e éticas e adotar práticas padronizadas. Em vez de considerar apenas o valor dos dados, é sensato questionar os métodos de obtenção e processamento de dados para qualquer finalidade. Assim, aqui estão nove códigos de conduta que todo cientista de dados deve seguir.

1. Observe os regulamentos

Os cientistas de dados devem conhecer os regulamentos de proteção de dados que se aplicam a determinados trabalhos. Caso contrário, você pode infringir a lei sem saber e colocar a si mesmo e aos outros em risco. Portanto, esse conhecimento é crucial para garantir um trabalho ético e evitar danos não intencionais.

Portanto, verifique as leis relevantes antes de se envolver em qualquer atividade. Além disso, não apenas observe os regulamentos para seguir as regras; também buscar uma compreensão mais profunda deles. Para observar adequadamente os regulamentos, você deve saber por que eles foram colocados e contra o que eles protegem.

Algumas leis de privacidade dignas de nota são o Regulamento Geral de Proteção de Dados da UE (RGPD) e a Lei de Privacidade do Consumidor da Califórnia (CCPA). Outros incluem HIPA, DPA, PIPEDA, LGPD e muitos regulamentos específicos do setor.

2. Respeite a Privacidade

Endereços, e-mails e IDs são identificadores que não devem ser públicos, pois representam riscos reais para as pessoas. Portanto, certifique-se de tornar esses detalhes o mais privados possível.

Se expostas, as vítimas podem sofrer roubo de identidade ou fraude. Eles também podem ser chantageados por pessoas que ameaçam divulgar suas informações confidenciais. Além disso, os profissionais podem sofrer danos à reputação e assédio online uma vez que suas preferências pessoais se tornem públicas. Isso pode afetar seus relacionamentos, oportunidades de carreira e posição social.

Portanto, com isso em mente, pesquise e selecione maneiras eficazes de melhorar identidades online seguras e desidentificar dados. Por exemplo, você pode substituir caracteres, remover identificadores diretos ou generalizar. Isso protege dados confidenciais de cibercriminosos enquanto ajuda as organizações com suas descobertas.

3. Elimine o viés

Os cientistas de dados confiam nas estatísticas para serem o mais objetivo possível. No entanto, apesar desses esforços, o viés persiste porque a noção de que dados maiores são mais precisos é uma das mais mitos comuns da ciência de dados.

Existe alguma verdade nisso, mas, infelizmente, dados grandes às vezes contêm elementos e estatísticas desnecessários ou falsos. Portanto, em vez de focar apenas nos números, certifique-se de que seus dados sejam limpos e representativos.

Limpar ou filtrar os dados antes do uso são excelentes métodos de combate ao viés. Por exemplo, você pode verificar erros ou usar amostragem estratificada para garantir dados representativos.

4. Não fabrique ou invente resultados

Fabricação é uma forma de má conduta de dados e fraude de pesquisa que envolve inventar descobertas e relatá-las como verdadeiras.

Por exemplo, um cientista de dados pode relatar que um medicamento não tem efeitos colaterais para a maioria dos membros de uma determinada faixa etária. Essas descobertas seriam fabricadas se não houvesse experimentos médicos iniciais e dados coletados para apoiá-los.

A fabricação tem consequências sérias e negativas para os cientistas de dados e para aqueles que dependem de seu trabalho. Isso pode destruir sua credibilidade, manchar a reputação de sua organização, prejudicar o público ou expor você a riscos legais.

5. Não falsifique ou manipule evidências

A falsificação é a manipulação da realidade, dados coletados para atender a uma agenda. Enquanto os fabricantes inventam resultados de dados inexistentes para apoiar suas reivindicações, os falsificadores trabalham para refutar dados reais e existentes por motivos pessoais. Para conseguir isso, eles podem adulterar equipamentos de pesquisa, alterar ou omitir dados totalmente.

A falsificação pode prejudicar o público ao fornecer informações falsas que afetam a tomada de decisões em vários setores. Por exemplo, um estudo de medicamento falsificado pode expor as pessoas a riscos desnecessários, tratamentos ineficazes ou efeitos colaterais nocivos. Também pode causar a perda de dinheiro, tempo ou materiais que poderiam ter sido usados ​​para outros fins.

Fabricação e falsificação são práticas inescrupulosas com efeitos adversos e inúmeras sanções. Isso pode incluir multas, revogação de credenciais, perda de financiamento de pesquisa ou prisão.

6. Mostrar Transparência

Transparência para cientistas de dados significa ser honesto sobre os métodos aplicados para coletar, analisar e apresentar dados. Os cientistas de dados devem estar abertos e prontos para compartilhar suas práticas com outros cientistas de dados e participantes do estudo.

Além disso, você deve obter o consentimento dos participantes do estudo porque publicar resultados sem consentimento informado pode desrespeitar ou prejudicar os participantes de várias maneiras. Eles podem violar sua dignidade, privacidade e autonomia ou expô-los a riscos nocivos e desnecessários decorrentes do estudo.

A transparência gera confiança com aqueles que dependem de seus dados para obter insights. Ele também garante a qualidade dos dados, permitindo que outros revisem seus resultados.

Além disso, a abertura entre os cientistas de dados promove a colaboração e o aprendizado. Você pode ajudar a fomentar a inovação compartilhando seu processo e comunicando o melhores métodos de visualização de dados e técnicas de ciência de dados para colegas enquanto aprende com eles.

7. Colete dados com segurança

Os cientistas de dados devem confirmar a segurança dos métodos usados ​​para coletar, analisar e armazenar dados. Isso evita possíveis violações de dados que podem afetar os cientistas de dados e os participantes do estudo.

As violações de dados colocam em risco a segurança pessoal, minam a confiança do público e expõem a incompetência organizacional, resultando em perdas financeiras surpreendentes para a empresa. Essas perdas podem ser ações judiciais das vítimas de violação de dados, menos clientes e muito mais.

Diante disso, você deve realizar pesquisas para encontrar o soluções de segurança de dados mais eficazes e aplicá-los. Por exemplo, você pode proteger conexões com criptografia TLS/SSL ou usar proxies rotativos. Além disso, você pode impor medidas de controle de acesso e criar backups em caso de ataque. Ao encontrar soluções, não se esqueça de compartilhá-las com outras pessoas para garantir a máxima segurança.

8. Use algoritmos com responsabilidade

Algoritmos não são apenas ferramentas para análise de dados. Eles são influências poderosas na vida, no comportamento e nas oportunidades das pessoas. No entanto, embora ajudem a resolver problemas e a fazer previsões inovadoras, também são imperfeitos.

Se não forem cuidadosamente projetados, testados ou implantados, os algoritmos têm impactos sociais e éticos que podem prejudicar certos grupos de pessoas. Eles também introduzem viés se treinados em dados que refletem preconceitos existentes e podem ser imprevisíveis. Assim, os cientistas de dados devem projetá-los e usá-los com responsabilidade.

Sempre escolha algoritmos apropriados, teste seu desempenho e explique como eles funcionam. Além disso, certifique-se de identificar possíveis fontes de viés e implemente mecanismos que atualizem ou corrijam quando necessário.

9. Considere as implicações de longo prazo do seu trabalho

Seu trabalho como cientista de dados impactará significativamente muitos aspectos da sociedade. Portanto, sempre considere como seus modelos afetam as pessoas.

Por exemplo, procure questionar se seu trabalho pode perpetuar o preconceito e a desigualdade ou comprometer a privacidade no futuro. Em seguida, trate adequadamente dessas preocupações.

Observe que uma visão voltada para o futuro é mais importante do que qualquer método corretivo, e pensar nos próximos dias é uma das maneiras mais eficazes de tomar decisões eticamente sólidas.

Você deve ser ético como cientista de dados

Como cientista de dados, você recebe um poder que vem com responsabilidade proporcional. Suas habilidades são raras, então você está na vanguarda da tomada de decisões organizacionais.

Suas decisões afetam tudo, desde os planos de negócios da empresa até os sistemas de justiça criminal. Portanto, você não deve fazê-los levianamente. Sempre seja honesto, ético e meticuloso em seu trabalho para proteger as pessoas dos dilemas éticos existentes em seu setor e em outros campos de tecnologia.