Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Visualização básica de dados tabulares com R #624

Open
ericbrasiln opened this issue Aug 8, 2024 · 24 comments
Open

Visualização básica de dados tabulares com R #624

ericbrasiln opened this issue Aug 8, 2024 · 24 comments

Comments

@ericbrasiln
Copy link
Member

Programming Historian em português recebeu uma proposta de aula intitulada 'Visualização básica de dados tabulares com R' por @dianamsmpsantos.

Os objetivos de aprendizagem da aula proposta são:

  • Compreender o conceito de folha de registo (dataframe) em R e como ele é utilizado para organizar dados tabulares.
  • Aprender a criar diferentes tipos de visualizações a partir de dados tabulares em R.

Eu compartilhei esta proposta para feedback com a equipa portuguesa. Consideramos esta proposta com base nos seguintes critérios:

  • Abertura: defendemos o uso de software de código aberto, linguagens de programação abertas e conjuntos de dados abertos.
  • Acesso global: atendemos a um público que trabalha com diferentes sistemas operacionais e recursos computacionais variados.
  • Multilinguismo: celebramos metodologias e ferramentas que podem ser aplicadas ou adaptadas para uso em contextos de pesquisa multilíngues.
  • Sustentabilidade: estamos comprometidos em publicar recursos de aprendizagem que possam permanecer úteis além das interfaces gráficas de usuário atuais e das versões de software em vigor.

Estamos felizes em convidar @dianamsmpsantos a desenvolver esta proposta em uma submissão sob a orientação de editor indicado em breve.

O pacote de submissão deve incluir:

  • Texto da lição (escrito em Markdown)
  • Figuras: imagens / gráficos / diagramas (se aplicável)
  • Recursos de dados: codebooks, conjunto de dados de exemplo (se aplicável)

@dianamsmpsantos já compartilhou o pacote de submissão comigo. Nossa equipe de Publicação processará os novos materiais da aula em setembro e preparará uma prévia do rascunho inicial. Eles discutirão qualquer dúvida com o colaborador e postarão um comentário nesta questão para fornecer a localização de todos os arquivos-chave, bem como um link para a prévia, onde os colaboradores poderão ler a lição conforme o rascunho avança.

Nossos ombudspersons dedicados são Ian Milligan (inglês), Silvia Gutiérrez De la Torre (español), Hélène Huet (francês) e Luis Ferla (português). Sinta-se à vontade para contatá-los a qualquer momento se tiver preocupações que gostaria de tratar com um observador imparcial. Entrar em contato com os ombudspersons não terá impacto no resultado de qualquer revisão por pares.

@anisa-hawes
Copy link
Contributor

Thank you, @ericbrasiln!

@charlottejmc and I will process these submission materials and set up the lesson preview for you this week ✨

@charlottejmc
Copy link
Collaborator

charlottejmc commented Sep 5, 2024

Olá @ericbrasiln e @dianamsmpsantos,

Pode encontrar os ficheiros principais aqui:

Pode consultar a pré-visualização da lição aqui:


Hello @dianamsmpsantos, my notes on this submission are pretty much the same as those I outlined in my comment on your other lesson, Investigar a literatura lusófona através dos tempos usando a Literateca:

  • The code is looking a little strange, for example at lines 112-114; 153-155; 159-162... Did you mean to separate the code individually line by line, or were you hoping for them to appear as code blocks instead? If you'd like them to appear as code blocks, I can make that change for you. In general, you might find it easier to read and write your code by simply using single backticks around short bits of code (in-line, or single lines of code).
  • I notice you have included an asset, but this file not is linked to directly from within the lesson (so that readers can access it). Would you be able to add the link in where relevant? You can point directly to the file on Github, for example like this: [dadosPeriodLit.tsv](https://github.com/programminghistorian/ph-submissions/blob/gh-pages/assets/visualizacao-basica-dados-tabulares-R/dadosPeriodLit.tsv).
  • Finally, I saw that you provided 'alt-text' for all images, thank you! Unfortunately, it is currently a little under-descriptive, so I'd like to ask whether you might be able to try adding some more information to them (please see my other comment for further details).

@dianamsmpsantos
Copy link
Collaborator

dianamsmpsantos commented Sep 11, 2024 via email

@dianamsmpsantos
Copy link
Collaborator

dianamsmpsantos commented Sep 11, 2024 via email

@charlottejmc
Copy link
Collaborator

Hi @dianamsmpsantos, I've received your images and have now switched them in the image folder!

If you could also tick off the checkboxes in my comment above when you have resolved those queries, that would be perfect.

Thank you! ✨

@dianamsmpsantos
Copy link
Collaborator

I think I ticked them off. Did I?
Thanks again!

@anisa-hawes anisa-hawes removed the status in Active Lessons Sep 11, 2024
@anisa-hawes anisa-hawes moved this to 2 Initial Edit in Active Lessons Sep 11, 2024
@anisa-hawes
Copy link
Contributor

Olá Diana @dianamsmpsantos,

What's happening now?

Your lesson has been moved to the next phase of our workflow which is Phase 2: Initial Edit.

In this phase, your editor Eric @ericbrasiln will read your lesson, and provide some initial feedback. Eric will post feedback and suggestions as a comment in this issue, so that you can revise your draft in the following phase (Phase 3: Revision 1).

%%{init: { 'logLevel': 'debug', 'theme': 'dark', 'themeVariables': {
              'cScale0': '#444444', 'cScaleLabel0': '#ffffff',
              'cScale1': '#886814', 'cScaleLabel1': '#ffffff',
              'cScale2': '#444444', 'cScaleLabel2': '#ffffff'
       } } }%%
timeline
Section Phase 1 <br> Submission
Who worked on this? : Publishing Assistant (@charlottejmc) 
All  Phase 1 tasks completed? : Yes
Section Phase 2 <br> Initial Edit
Who's working on this? : Editor (@ericbrasiln)  
Expected completion date? : October 11
Section Phase 3 <br> Revision 1
Who's responsible? : Author (@dianamsmpsantos) 
Expected timeframe? : ~30 days after feedback is received
Loading

Note: The Mermaid diagram above may not render on GitHub mobile. Please check in via desktop when you have a moment.

@ericbrasiln
Copy link
Member Author

Hi @anisa-hawes,

I’ve already reviewed Diana’s lesson, and the initial feedback and comments were addressed during my previous discussions with her. We are ready to move on to the next phase. I’m also in the process of finding editors for the lesson.

Best regards

@anisa-hawes anisa-hawes moved this from 2 Initial Edit to 3 Revision 1 in Active Lessons Oct 2, 2024
@anisa-hawes
Copy link
Contributor

Olá Diana @dianamsmpsantos,

What's happening now?

Your lesson has been moved to the next phase of our workflow which is Phase 3: Revision 1.

I understand that you have already revised your draft in response to @ericbrasiln's initial feedback.
As you and Eric are both happy with this revised draft, we will now move forward to Phase 4: Open Peer Review.

%%{init: { 'logLevel': 'debug', 'theme': 'dark', 'themeVariables': {
              'cScale0': '#444444', 'cScaleLabel0': '#ffffff',
              'cScale1': '#886814', 'cScaleLabel1': '#ffffff',
              'cScale2': '#444444', 'cScaleLabel2': '#ffffff'
       } } }%%
timeline
Section Phase 2 <br> Initial Edit
Who worked on this? : Editor (@ericbrasiln) 
All  Phase 2 tasks completed? : Yes
Section Phase 3 <br> Revision 1
Who's working on this? : Author (@dianamsmpsantos)  
Expected completion date? : DONE
Section Phase 4 <br> Open Peer Review
Who's responsible? : Reviewers (TBC) 
Expected timeframe? : ~60 days after request is accepted
Loading

Note: The Mermaid diagram above may not render on GitHub mobile. Please check in via desktop when you have a moment.

@anisa-hawes anisa-hawes moved this from 3 Revision 1 to 4 Open Peer Review in Active Lessons Oct 2, 2024
@anisa-hawes
Copy link
Contributor

anisa-hawes commented Oct 2, 2024

Olá Diana @dianamsmpsantos,

What's happening now?

Your lesson has been moved to the next phase of our workflow which is Phase 4: Open Peer Review.

This phase is an opportunity for you to hear feedback from peers in the community.

Eric @ericbrasiln will invite two reviewers to read your lesson, test your code, and provide constructive feedback. In the spirit of openness, reviews will be posted as comments in this issue (unless you specifically request a closed review).

After both reviews, Eric will summarise the suggestions to clarify your priorities in Phase 5: Revision 2.

%%{init: { 'logLevel': 'debug', 'theme': 'dark', 'themeVariables': {
              'cScale0': '#444444', 'cScaleLabel0': '#ffffff',
              'cScale1': '#886814', 'cScaleLabel1': '#ffffff',
              'cScale2': '#444444', 'cScaleLabel2': '#ffffff'
       } } }%%
timeline
Section Phase 3 <br> Revision 1
Who worked on this? : Author (@dianamsmpsantos)
All  Phase 3 tasks completed? : Yes
Section Phase 4 <br> Open Peer Review
Who's working on this? : Reviewers (@JimmyMedeiros82 + @tarssioesa)
Expected completion date? : ~60 days after request is accepted
Section Phase 5 <br> Revision 2
Who's responsible? : Author (@dianamsmpsantos)
Expected timeframe? : ~30 days after editor's summary
Loading

Note: The Mermaid diagram above may not render on GitHub mobile. Please check in via desktop when you have a moment.

@anisa-hawes
Copy link
Contributor

Hello Diana @dianamsmpsantos,

We welcome additional reviews from your colleagues ! Members of the wider community may also choose to contribute reviews.

This lesson is available to read as a preview here: http://programminghistorian.github.io/ph-submissions/pt/esbocos/originais/visualizacao-basica-dados-tabulares-R

We ask that:

  • All participants read and be guided by our shared Code of Conduct.
  • All participants adhere to our anti-harassment policy:

Política anti-assédio

Esta é uma declaração dos princípios do Programming Historian em português onde são definidas as expectativas para o tom e estilo de toda a comunicação entre revisores, autores, editores e participantes dos nossos fóruns públicos.

Programming Historian em português dedica-se a criar um ambiente académico aberto em que os membros da comunidade podem examinar em liberdade e detalhadamente ideias, fazer perguntas, sugestões ou pedir esclarecimentos. Este espaço tem que ser livre de assédio para todos no projeto, independentemente do género, identidade e expressão de género, orientação sexual, deficiência, aparência física, raça, idade ou religião ou experiência técnica. Não é tolerado de nenhuma forma qualquer assédio ou ataque ad hominem a membros da comunidade. Os membros que violarem estas regras podem ser expulsos da comunidade, por avaliação do conselho editorial. Se alguém testemunhar ou sentir que foi vítima das atividades descritas acima, deve entrar em contato com o nosso mediador independente Luis Ferla. Obrigado por nos ajudar a criar um espaço seguro.

@ericbrasiln
Copy link
Member Author

Bom dia, gente!

Informo que @JimmyMedeiros82 e @tarssioesa aceitaram ser os revisores da lição inédita proposta pela @dianamsmpsantos

Coloco aqui as Diretrizes para revisores.

Podem incluir suas revisões e sugestões em um comentário aqui na issue, de preferência utilizando tasklist (- [ ]), e indicando a linha do markdown.

Os arquivos referentes à lição podem ser acessados nos seguintes links:

Qualquer dúvida é só me marcar por aqui.

Agradeço a colaboração dos colegas e à contribuição inédita da @dianamsmpsantos.

@JimmyMedeiros82
Copy link
Contributor

Vai ser ótimo colaborar com a revisão da lição.
Em alguns dias enviarei os comentários.

@JimmyMedeiros82
Copy link
Contributor

Uma primeira questão que levanto no processo de revisão é o uso da expressão "folha de registro" para traduzir dataframe.
Pelo que leio em artigos e livros e ouço em conversas com colegas que usam linguagem R, nunca ouvi a expressão. Em geral, é utilizado o termo "banco de dados" para traduzir dataframe. Seria melhor usar banco de dados?

@JimmyMedeiros82
Copy link
Contributor

A expressão utilizada na lição https://programminghistorian.org/pt/licoes/nocoes-basicas-R-dados-tabulares foi "conjunto de dados". Uma opção, talvez, seja uniformizar as lições.

@JimmyMedeiros82
Copy link
Contributor

A lição é interessante, está bem organizada e útil para iniciantes na linguagem R.
Seguem as minhas sugestões de ajustes no texto da lição:

#29 Melhor mudar “Nesta lição consideramos que já” por “Nesta lição, consideramos que o leitor já”.
#37 Modificar a frase “Quem não teve já ao longo da sua vida de preencher uma folha de registo numa aula,” por “Quem não teve, ao longo da sua vida, que preencher uma folha de registo numa aula,”.
#45 Mudar a frase “Praticamente todos os dados que usamos no R”, pois ela não é verdadeira. Existem muitos dados não estruturados que são manipulados em R. Melhor usar “Existem muitos dados em R”.
#55 adicionar “(concatenar)” depois de “c()” para deixar o texto bem explicativo para o leitor.
#152 Mudar “folhinha de registo” por “folha de registo” ou outro termo a ser adotado.
#207 Mudar “o valor dos 25% e a de cima o de 70%,” por “o valor dos 25% e a de cima o de 75%,”.

@dianamsmpsantos
Copy link
Collaborator

dianamsmpsantos commented Nov 11, 2024 via email

@JimmyMedeiros82
Copy link
Contributor

Diana, em publicação acadêmica eu encontro o uso dos termos "banco de dados", "conjunto de dados" e "dataframe". Nunca li folha de registro. Minha sugestão é não adotar esse termo, pois não será facilmente compreendido.

Inclusive pelo exemplo mencionado na lição, parecia que a folha de registro era um tipo de controle em portaria de edifício comercial, quando para acessar é necessário informar alguns dados pessoais. A compreensão do que está sendo informado não foi facilmente compeendido. Acho que tem que é melhor adotar termos que já são compreendidos pelos leitores em vez de cunhar uma expressão que gostamos.

@charlottejmc
Copy link
Collaborator

Olà @dianamsmpsantos,

Just to respond to your question: please wait for the second reviewer to provide their feedback first. Then, Eric will summarise the two reviews to give you a clear sense of the revisions to work through in Phase 5. You'll be able to start making changes once we've changed the phase label to '5. Revision'.

Muito obrigada!

@charlottejmc
Copy link
Collaborator

Olá @tarssioesa, how are you?

We are still waiting for your review of @dianamsmpsantos's lesson. Are you still able to commit to providing your feedback, ideally over the next few weeks?

As Eric outlined in his comment:

Coloco aqui as Diretrizes para revisores.

Podem incluir suas revisões e sugestões em um comentário aqui na issue, de preferência utilizando tasklist (- [ ]), e indicando a linha do markdown.

Os arquivos referentes à lição podem ser acessados nos seguintes links:

If you have any questions, please let us know.

@tarssioesa
Copy link

tarssioesa commented Feb 19, 2025

  1. Observações gerais:

Olá, tudo bem? Eu não tenho experiência com o português de Portugal, por isto algumas frases que eu pontuei podem não fazer sentido apenas para mim. Tentei fazer uma revisão minuciosa e dividi as observações em: Sugestões, Alterações e Erros (que descobri agora que foi apontado por @JimmyMedeiros82 no 207).

Também, tento fazer referência aos parágrafos, achei mais prático, e aos códigos que vem após estes.

Estou aberto para que possamos debater e parabenizo, desde já, a lição.

  1. Observações sobre a lição:

É uma lição na qual os códigos todos funcionam, existe uma coerência na ordem em que são apresentadas as funções e é bastante adequada para o nível proposto: Iniciante. Minhas observações buscam enriquecer a lição e minimizar as dúvidas dos leitores.

  1. Revisão:
  • Sugestão - Parágrafo 6: Neste parágrafo está escrito: ‘Uma folha de registo é pois representada por uma tabela, que tem o mesmo tipo de informação em cada uma das suas colunas, mas que pode ter colunas diferentes com informação diferente.’. Acho que a redação não funciona bem em português brasileiro, não me parece claro o que quer ser dito. Eu tentaria algo na linha de: ‘Uma folha de registo é pois representada por uma tabela, que em cada uma das suas colunas possuem o mesmo tipo de dado, mas que pode ter colunas diferentes com informação diferente.’.
  • Sugestão - Parágrafo 8: É interessante mostrar uma view do banco de dados criado.
  • Sugestão - Parágrafo 14: Neste caso, ao invés de criarmos um vetor, como feito no parágrafo 8, adicionamos um único valor: masc e a coluna sexo é toda preenchida com este valor. Para o nível da lição proposta, seria interessante mostrar esta equivalência.
  • Inclusão - Parágrafo 15: Necessário deixar claro que o vetor deve ter o mesmo número de elementos do que o número de colunas da folha de registro. Caso não, o R repetirá os valores dos vetores, quando ele tiver menos colunas que a folha de registro, ou, caso tenha mais valores que a folha de resposta, serão utilizados apenas os primeiros valores do vetor até completar a linha da folha de registro.
  • Sugestão - Parágrafo 20: Sugiro evidenciar que factor representa na estatística uma variável categórica.
  • Inclusão - Parágrafo 28: O gráfico proposto não aparece na lição.
  • Inclusão - Parágrafo 28: Inclusão de um pequeno parágrafo com uma view que explique e exemplifique o que a função table faz, usada no barplot.
  • Inclusão - Parágrafo 36: O gráfico proposto não aparece na lição.
  • Sugestão - Parágrafo 47: Na lição proposta, seria mais didático que se demonstrasse primeiro a criação/junção de uma nova variável que representasse a proporção de palavras de cor e somente depois se apresentasse oboxplot.
  • Alteração - Parágrafo 51: O gráfico proposto não aparece na lição.
  • Alteração - Parágrafo 52: Os gráficos apresentados estão com os títulos incompletos, adequar tamanho dos títulos.
  • Alteração - Parágrafo 56: A introdução sobre a função merge é muito curta para a importância que este tipo de operação tem quando se fala de banco de dados. Acredito que é necessário um esforço para elucidar melhor o que é uma junção de banco de dados.
  1. Conclusão:

Desde já, agradeço o convite e me ponho a disposição para sanar dúvidas que possam decorrer da revisão. E mais uma vez, parabéns.

@charlottejmc
Copy link
Collaborator

charlottejmc commented Feb 20, 2025

Thank you for participating in the peer review, @JimmyMedeiros82 and @tarssioesa.


Hello @dianamsmpsantos,

The next step is for @ericbrasiln to summarise the suggestions made by @JimmyMedeiros82 and @tarssioesa so that you are clear about what to prioritise during the next phase (Phase 5: Revision 2).

@dianamsmpsantos
Copy link
Collaborator

dianamsmpsantos commented Feb 20, 2025 via email

@charlottejmc charlottejmc moved this from 4 Open Peer Review to 5 Revision 2 in Active Lessons Feb 21, 2025
@charlottejmc
Copy link
Collaborator

charlottejmc commented Feb 21, 2025

Thank you @dianamsmpsantos. It would be helpful if you could also tick all the boxes that you completed.


Next, the Managing Editor @ericbrasiln will read through your lesson again to confirm that it can move to the next step in the publishing workflow which is Phase 6: Sustainability + Accessibility.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
Status: 5 Revision 2
Development

No branches or pull requests

6 participants